WedX - журнал о программировании и компьютерных науках

читать данные, пропуская имя столбца в pandas

У меня есть неструктурированные данные, и мне нужно с ними немного поработать.
university_towns.txt:

Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]

Когда я прочитал этот файл с помощью pd.read_table, я получил имя pandas для столбца, который мне нужен, в первой строке («Alabama [edit]»).

def get_list_of_university_towns():
    df = pd.read_table('university_towns.txt')
    df = df.reset_index()
    return list(df)
> ['index', 'Alabama[edit]']

Как сбросить это «автоматическое присвоение имен», чтобы оба столбца имели собственные имена и я не терял первую строку («Алабама[править]»)?

Я думаю, что в read_table< может быть передан определенный аргумент. /a>, но я не уверен, какой именно.


  • Вы можете использовать pd.read_table('university_towns.txt', header=None) 17.05.2017
  • Потрясающий. Я пробовал и 0, и 1, но None сделал свое дело! 17.05.2017

Ответы:


1

Вы можете сделать это несколькими способами.

Например:

Вы можете определить имена столбцов при использовании pd.read_table:

col=["Города"]

df=pd.read_table("D:\datos\university_towns.txt.txt", names=col)

17.05.2017
  • Это тоже работает, но header=None работает лучше. Спасибо 17.05.2017
  • Конечно!!! Я предположил, что вы хотите назвать свои столбцы данных, но я ошибался 17.05.2017
  • Новые материалы

    Как проанализировать работу вашего классификатора?
    Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

    Работа с цепями Маркова, часть 4 (Машинное обучение)
    Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

    Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
    Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

    Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
    Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

    Учебные заметки: создание моего первого пакета Node.js
    Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

    Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
    Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

    ИИ в аэрокосмической отрасли
    Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..


    Для любых предложений по сайту: [email protected]