Руководство по чтению нескольких листов в файле Excel с использованием Python.
Итак, первый шаг — определить листы, которые вы хотите прочитать, а затем поместить эти листы в список. В моем случае мне нужно было собрать ряд терминов на нескольких листах, а затем использовать эти термины для создания дополнительных столбцов в DataFrame. Наконец, мне пришлось заполнить данные на основе содержимого нескольких текстовых файлов, полученных в процессе распознавания текста, для извлечения текста из pdf-документов.
В моем случае это названия листов.
sheetnames = [‘Art’, ‘Plane’, ‘Yacht’, ‘Hedge Funds’]
Затем я определил имена столбцов на листах Excel.
cols = [‘Full Name’, ‘Manufacturer/Model’, ‘Manufacturer/Model’, 'Funds']
Затем я создал пустой список для хранения терминов.
terms = []
Затем я перебрал столбцы и загрузил листы. Я использовал перечисление, чтобы отслеживать имена листов. Затем я перебрал фрейм данных, который я прочитал, чтобы создать полный список терминов. В итоге я получил список примерно из 500 терминов.
filename = 'd:/freelancing/projects/ej/UCC Web Scraping List.xlsx’ for i, col in enumerate(cols): df_terms = pd.read_excel(filename, sheet_name = sheetnames[i]) for index, row in df_terms.iterrows(): terms.append(row[col])
И вот оно. Спасибо за чтение.
Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Присоединяйтесь к нашему сообществу Discord.