У меня есть неструктурированные данные, и мне нужно с ними немного поработать.
university_towns.txt:
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Когда я прочитал этот файл с помощью pd.read_table, я получил имя pandas для столбца, который мне нужен, в первой строке («Alabama [edit]»).
def get_list_of_university_towns():
df = pd.read_table('university_towns.txt')
df = df.reset_index()
return list(df)
> ['index', 'Alabama[edit]']
Как сбросить это «автоматическое присвоение имен», чтобы оба столбца имели собственные имена и я не терял первую строку («Алабама[править]»)?
Я думаю, что в read_table< может быть передан определенный аргумент. /a>, но я не уверен, какой именно.
header=None
работает лучше. Спасибо 17.05.2017