В этом посте мы рассмотрим еще несколько функций Pandas.
info(): возвращает сводную информацию о DataFrame, включая размер и типы данных каждого столбца, а также количество ненулевых значений.
Функции info() и describe() кажутся похожими. Но они отличаются, потому что функция info() возвращает информацию о столбцах, а функция describe() генерирует статистическую сводку для числовых столбцов фрейма данных.
Например:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Salary': [50000, 70000, 90000]} df = pd.DataFrame(data) df.info() df.describe()
loc[]: позволяет получить доступ к подмножеству строк и столбцов DataFrame с помощью индексации на основе меток. Например:
import pandas as pd df = pd.read_csv('data.csv') df.loc[10:20, ['col1', 'col2']]
Функцию loc() также можно использовать для фильтрации строк по условию. Давайте заново загрузим фрейм данных и покажем его.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df.loc[df['A'] > 1] # A B #1 2 5 #2 3 6
iloc[]: позволяет получить доступ к подмножеству строк и столбцов DataFrame с помощью целочисленной индексации. Он похож на loc(), но работает с позиционной индексацией. Например:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) df.iloc[0:2, 0:2]
drop(): удаляет один или несколько столбцов или строк из DataFrame. Например:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) df.drop('A', axis=1)
Основы Pandas 1:https://medium.com/@bigfundu/panda-basics-1-1b338cc020c3