Руководство по чтению нескольких листов в файле Excel с использованием Python.

Итак, первый шаг — определить листы, которые вы хотите прочитать, а затем поместить эти листы в список. В моем случае мне нужно было собрать ряд терминов на нескольких листах, а затем использовать эти термины для создания дополнительных столбцов в DataFrame. Наконец, мне пришлось заполнить данные на основе содержимого нескольких текстовых файлов, полученных в процессе распознавания текста, для извлечения текста из pdf-документов.

В моем случае это названия листов.

sheetnames = [‘Art’, ‘Plane’, ‘Yacht’, ‘Hedge Funds’]

Затем я определил имена столбцов на листах Excel.

cols = [‘Full Name’, ‘Manufacturer/Model’, ‘Manufacturer/Model’, 'Funds']

Затем я создал пустой список для хранения терминов.

terms = []

Затем я перебрал столбцы и загрузил листы. Я использовал перечисление, чтобы отслеживать имена листов. Затем я перебрал фрейм данных, который я прочитал, чтобы создать полный список терминов. В итоге я получил список примерно из 500 терминов.

filename = 'd:/freelancing/projects/ej/UCC Web Scraping List.xlsx’
for i, col in enumerate(cols):
     df_terms = pd.read_excel(filename, sheet_name = sheetnames[i])
     for index, row in df_terms.iterrows():
          terms.append(row[col])

И вот оно. Спасибо за чтение.

Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Присоединяйтесь к нашему сообществу Discord.