Вопросы по теме 'dataframe'
Нормализовать значения в мультииндексном фрейме данных?
Как нормализовать мультииндексный фрейм данных?
Скажем, у меня есть кадр данных:
d = pd.DataFrame([["a",1,3],["a",2,2],["b",4,4],["b",5,8]],
columns=["name","value1","value2"])
как рассчитать нормализованные значения для...
30.03.2024
Замена значений NA на 0 в R
Я пытаюсь заменить свои значения NA в data.frame на 0. Я знаю, что это очень простой вопрос, но по какой-то причине он не работает для меня. Это мой код до сих пор:
library(XLConnect)
filenames <- list.files( paste(mainDir,sep=""),...
17.04.2024
R - столбец беговых баллов для спортивных результатов
У меня есть большой набор данных о забитых головах в футбольных матчах, отсортированных по матчу и последовательности забитых мячей. Это в следующем формате. В настоящее время у меня есть только первые 2 столбца, третий - это то, что я изо всех сил...
26.04.2024
Объединение двух фреймов данных с использованием нескольких столбцов в качестве ключей, хранящихся в массиве в Apache Spark
Как рассчитать объединение двух фреймов данных, используя несколько столбцов в качестве ключа? Например, DF1, DF2 - это два фрейма данных.
Это способ, которым мы можем вычислить соединение,
JoinDF = DF1.join(DF2, DF1("column1") ===...
06.04.2024
Выполнить ifelse() для каждого элемента фрейма данных, но разные тесты для каждого столбца в R
У меня есть большой фрейм данных [4000 600], и я хотел бы преобразовать элементы в 0, если они меньше, чем на три порядка меньше максимума каждого столбца. Таким образом, каждый элемент необходимо сравнить с максимальным значением своего столбца, и...
19.04.2024
Применение тайдыра отдельно только к определенным строкам
Я пытаюсь использовать tidyr для разделения одного столбца в моем фрейме данных, применяя его только к определенным строкам. Хотя dplyr::filter выполняет свою работу, он пропускает остальные мои данные. Есть ли чистый способ применить tidyr к...
16.03.2024
читать данные, пропуская имя столбца в pandas
У меня есть неструктурированные данные, и мне нужно с ними немного поработать. university_towns.txt :
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston...
23.04.2024
Избегайте двойного кодирования JSON при объединении двух вызовов to_json от Pandas
У меня есть два кадра данных (узлы и ссылки), которые JSONified вызовом to_json Pandas:
links = links.to_json(orient='records')
nodes = nodes.to_json(orient='records')
Результат этих вызовов выглядит так, как ожидалось:
Ссылки:...
06.04.2024
Пользовательская функция с агрегированием таблиц данных
Я пытаюсь написать функцию в основном с наборами данных агрегации/слияния/подмножества. Мой фрейм данных выглядит так:
NameA NameB NameC Score1 Score2
A F K 3 3
B F L 5 5
C F...
19.03.2024
Установите для всех значений в одном столбце значение NaN, если соответствующие значения в другом столбце также равны NaN.
Цель состоит в том, чтобы сохранить взаимосвязь между двумя столбцами, установив значение NaN для всех значений из одного столбца в другом столбце.
Имея следующий фрейм данных:
df = pd.DataFrame({'a': [np.nan, 2, np.nan, 4],'b': [11, 12 , 13,...
09.04.2024
Юлия - линейная регрессия - ОШИБКА: несоответствие размеров
Я хочу выполнить линейную регрессию в Julia, но получаю сообщение об ошибке: DimensionMismatch («длина столбца 3000 для столбца (столбцов) X и несовместима с длиной столбца 1000 для столбца (столбцов) Y»)
julia> x=rand(1000,3);
julia>...
03.04.2024
Поиск способа эффективного выполнения вычислений для определенного столбца DataFrame
Я пытаюсь просмотреть конкретный столбец Pandas DataFrame и пытаюсь сделать следующее:
col0 col1 col2
int0 float0 str0
int1 float1 str0
int2 float2 str1
Я пытаюсь просто перебирать DataFrame построчно в этом столбце, но это не кажется...
08.04.2024
yyyy-MM-ddT00:00:00 до yyyy-MM-dd 00:00:00 в кадре данных Pandas
Я считаю, что моя проблема действительно проста, и должен быть действительно простой способ решить эту проблему с пандами, о котором я до сих пор не знаю.
Проблема в том, что у меня есть один столбец в кадре данных pandas, все элементы которого...
28.03.2024
Как объединить несколько столбцов с похожими именами в кадре данных Pandas без потери данных
Я работаю с некоторыми запутанными данными и пытаюсь понять, как объединить несколько столбцов с похожей информацией в один столбец. Например, у меня есть кадр данных, который выглядит так, и я хочу знать, как объединить все три столбца в один:...
14.04.2024
Как создать больший фрейм данных из меньших фреймов данных с одинаковыми именами столбцов в R [дубликаты]
У меня есть 76 небольших фреймов данных по 288 строк и 11 столбцов в каждом, и я хотел бы связать все вместе в большом фрейме данных. У них одинаковые имена столбцов, поэтому я хотел бы, чтобы они были связаны строками (288*76 строк в конце)....
07.04.2024
Как создать новый столбец на основе совпадающих значений в двух разных фреймах данных?
У меня есть два фрейма данных:
df1 (строка для каждого события, происходящего в игре)
Date
Game
Event Type
Player
Time
02/28/10
USA vs Canada
Faceoff
Sidney Crosby
20:00
02/28/10
USA vs Canada
Pass...
18.03.2024
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..