WedX - журнал о программировании и компьютерных науках

Вопросы по теме 'dataframe'

Нормализовать значения в мультииндексном фрейме данных?
Как нормализовать мультииндексный фрейм данных? Скажем, у меня есть кадр данных: d = pd.DataFrame([["a",1,3],["a",2,2],["b",4,4],["b",5,8]], columns=["name","value1","value2"]) как рассчитать нормализованные значения для...

Замена значений NA на 0 в R
Я пытаюсь заменить свои значения NA в data.frame на 0. Я знаю, что это очень простой вопрос, но по какой-то причине он не работает для меня. Это мой код до сих пор: library(XLConnect) filenames <- list.files( paste(mainDir,sep=""),...
17.04.2024

R - столбец беговых баллов для спортивных результатов
У меня есть большой набор данных о забитых головах в футбольных матчах, отсортированных по матчу и последовательности забитых мячей. Это в следующем формате. В настоящее время у меня есть только первые 2 столбца, третий - это то, что я изо всех сил...
26.04.2024

Объединение двух фреймов данных с использованием нескольких столбцов в качестве ключей, хранящихся в массиве в Apache Spark
Как рассчитать объединение двух фреймов данных, используя несколько столбцов в качестве ключа? Например, DF1, DF2 - это два фрейма данных. Это способ, которым мы можем вычислить соединение, JoinDF = DF1.join(DF2, DF1("column1") ===...

Выполнить ifelse() для каждого элемента фрейма данных, но разные тесты для каждого столбца в R
У меня есть большой фрейм данных [4000 600], и я хотел бы преобразовать элементы в 0, если они меньше, чем на три порядка меньше максимума каждого столбца. Таким образом, каждый элемент необходимо сравнить с максимальным значением своего столбца, и...
19.04.2024

Применение тайдыра отдельно только к определенным строкам
Я пытаюсь использовать tidyr для разделения одного столбца в моем фрейме данных, применяя его только к определенным строкам. Хотя dplyr::filter выполняет свою работу, он пропускает остальные мои данные. Есть ли чистый способ применить tidyr к...
16.03.2024

читать данные, пропуская имя столбца в pandas
У меня есть неструктурированные данные, и мне нужно с ними немного поработать. university_towns.txt : Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Livingston...
23.04.2024

Избегайте двойного кодирования JSON при объединении двух вызовов to_json от Pandas
У меня есть два кадра данных (узлы и ссылки), которые JSONified вызовом to_json Pandas: links = links.to_json(orient='records') nodes = nodes.to_json(orient='records') Результат этих вызовов выглядит так, как ожидалось: Ссылки:...

Пользовательская функция с агрегированием таблиц данных
Я пытаюсь написать функцию в основном с наборами данных агрегации/слияния/подмножества. Мой фрейм данных выглядит так: NameA NameB NameC Score1 Score2 A F K 3 3 B F L 5 5 C F...
19.03.2024

Установите для всех значений в одном столбце значение NaN, если соответствующие значения в другом столбце также равны NaN.
Цель состоит в том, чтобы сохранить взаимосвязь между двумя столбцами, установив значение NaN для всех значений из одного столбца в другом столбце. Имея следующий фрейм данных: df = pd.DataFrame({'a': [np.nan, 2, np.nan, 4],'b': [11, 12 , 13,...

Юлия - линейная регрессия - ОШИБКА: несоответствие размеров
Я хочу выполнить линейную регрессию в Julia, но получаю сообщение об ошибке: DimensionMismatch («длина столбца 3000 для столбца (столбцов) X и несовместима с длиной столбца 1000 для столбца (столбцов) Y») julia> x=rand(1000,3); julia>...
03.04.2024

Поиск способа эффективного выполнения вычислений для определенного столбца DataFrame
Я пытаюсь просмотреть конкретный столбец Pandas DataFrame и пытаюсь сделать следующее: col0 col1 col2 int0 float0 str0 int1 float1 str0 int2 float2 str1 Я пытаюсь просто перебирать DataFrame построчно в этом столбце, но это не кажется...

yyyy-MM-ddT00:00:00 до yyyy-MM-dd 00:00:00 в кадре данных Pandas
Я считаю, что моя проблема действительно проста, и должен быть действительно простой способ решить эту проблему с пандами, о котором я до сих пор не знаю. Проблема в том, что у меня есть один столбец в кадре данных pandas, все элементы которого...

Как объединить несколько столбцов с похожими именами в кадре данных Pandas без потери данных
Я работаю с некоторыми запутанными данными и пытаюсь понять, как объединить несколько столбцов с похожей информацией в один столбец. Например, у меня есть кадр данных, который выглядит так, и я хочу знать, как объединить все три столбца в один:...

Как создать больший фрейм данных из меньших фреймов данных с одинаковыми именами столбцов в R [дубликаты]
У меня есть 76 небольших фреймов данных по 288 строк и 11 столбцов в каждом, и я хотел бы связать все вместе в большом фрейме данных. У них одинаковые имена столбцов, поэтому я хотел бы, чтобы они были связаны строками (288*76 строк в конце)....
07.04.2024

Как создать новый столбец на основе совпадающих значений в двух разных фреймах данных?
У меня есть два фрейма данных: df1 (строка для каждого события, происходящего в игре) Date Game Event Type Player Time 02/28/10 USA vs Canada Faceoff Sidney Crosby 20:00 02/28/10 USA vs Canada Pass...

Новые материалы

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..


Для любых предложений по сайту: wedx@cp9.ru