Только основы. Что такое Конда? Почему вам следует использовать Conda? Как установить Conda?

Что такое Конда?

Conda - это система управления пакетами и средой с открытым исходным кодом, работающая в Windows, Mac OS и Linux.

  • Conda может быстро устанавливать, запускать и обновлять пакеты и связанные с ними зависимости.
  • Conda может создавать, сохранять, загружать и переключаться между программными средами для конкретных проектов на вашем локальном компьютере.
  • Хотя Conda была создана для программ Python, Conda может упаковывать и распространять программное обеспечение для любого языка, такого как R, Ruby, Lua, Scala, Java, JavaScript, C, C ++, FORTRAN.

Conda как менеджер пакетов помогает находить и устанавливать пакеты. Если вам нужен пакет, для которого требуется другая версия Python, вам не нужно переключаться на другой менеджер среды, потому что Conda также является менеджером среды. С помощью всего нескольких команд вы можете настроить совершенно отдельную среду для запуска этой другой версии Python, продолжая запускать свою обычную версию Python в своей обычной среде.

Конда против Миниконды против Анаконды

Пользователи часто не понимают, в чем разница между Conda, Miniconda и Anaconda. В документации Planemo есть отличная диаграмма, которая прекрасно демонстрирует разницу между средой Conda и инструментом управления пакетами и дистрибутивами Miniconda и Anaconda Python (примечание: в дистрибутиве Anaconda Python теперь более 150 дополнительных пакетов!).

Я предлагаю установить Miniconda, который объединяет Conda с Python 3 (и небольшим количеством пакетов основных систем) вместо полного дистрибутива Anaconda. Установка только Miniconda побудит вас создавать отдельные среды для каждого проекта (и устанавливать только те пакеты, которые вам действительно нужны для каждого проекта!), Что улучшит переносимость и воспроизводимость ваших исследований и рабочих процессов.

Кроме того, если вам действительно нужна конкретная версия полного дистрибутива Anaconda, вы всегда можете создать новую conda среду и установить ее
с помощью следующей команды.

conda create --name anaconda-2020-02 anaconda=2020.02

Почему вам следует использовать Conda?

Из множества различных систем управления пакетами и средой, окружающих Conda, это одна из немногих, специально предназначенных для специалистов по данным.

  • Conda предоставляет готовые пакеты или двоичные файлы (что обычно позволяет избежать компиляции пакетов из исходного кода). TensorFlow - это пример инструмента, широко используемого специалистами по обработке данных, который сложно установить исходный код (особенно с поддержкой графического процессора), но который можно установить с помощью Conda за один шаг.
  • Conda - кроссплатформенный продукт с поддержкой Windows, MacOS, GNU / Linux и поддержкой нескольких аппаратных платформ, таких как x86 и Power 8 и 9. В следующем сообщении блога я покажу, как сделать вашу среду Conda воспроизводимой на этих платформах. разные платформы.
  • Если библиотека или инструменты еще не упакованы для установки с использованием conda, Conda позволяет использовать другие инструменты управления пакетами (например, pip) внутри сред Conda.

Используя Conda, вы можете быстро установить часто используемые библиотеки и инструменты для анализа данных, такие как R, NumPy, SciPy, Scikit-learn, Dask, TensorFlow, PyTorch, Fast.ai. », NVIDIA RAPIDS и другие, созданные с использованием оптимизированных аппаратных библиотек (таких как Intel MKL или NVIDIA CUDA ), что обеспечивает ускорение без изменения какого-либо кода.

Как установить Miniconda?

Загрузите 64-разрядную версию Python 3 подходящего установщика Miniconda для вашей операционной системы и следуйте инструкциям. Я расскажу о шагах по установке в системах Linux ниже, поскольку установка в системах Linux немного сложнее.

Загрузите 64-битный скрипт установки Python 3 для Miniconda.

wget --quiet https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

Запустите сценарий установки Miniconda.

bash Miniconda3-latest-Linux-x86_64.sh

Скрипт представит несколько подсказок, которые позволят вам настроить установку Miniconda. Обычно я рекомендую вам принять настройки по умолчанию. Однако, когда будет предложено следующее…

Do you wish the installer to initialize Miniconda3
by running conda init?

… Я рекомендую вам ввести yes (а не no по умолчанию), чтобы избежать необходимости вручную инициализировать Conda для Bash позже. Если вы случайно примете значение по умолчанию, не беспокойтесь. Когда сценарий завершится, вам просто нужно ввести следующие команды.

conda init bash
source ~/.bashrc

После завершения сценария установки вы можете удалить его.

rm Miniconda3-latest-Linux-x86_64.sh

Инициализация оболочки для Conda

После установки Miniconda вам необходимо настроить предпочитаемую оболочку для работы с conda. Вам может быть предложено инициализировать Conda для вашей оболочки при запуске сценария установки. Если да, то этот шаг можно смело пропустить.

conda init bash
source ~/.bashrc
(base) $ # prompt indicates that the base environment is active!

Обновление Conda

Рекомендуется обновлять вашу установку Conda до последней
версии. Следующая команда обновит Conda до самой последней версии.

conda update --name base conda --yes

Удаление Miniconda

При установке нового программного обеспечения всегда полезно понимать, как его удалить (на случай, если у вас возникнут сомнения!). Удалить Miniconda довольно просто.

Деинициализируйте оболочку, чтобы удалить контент, связанный с Conda, из ~/.bashrc.

conda init --reverse bash

Удалите весь каталог ~/miniconda3.

rm -rf ~/miniconda3

Удалите весь каталог ~/.conda.

rm -rf ~/.conda

Если он присутствует, удалите файл конфигурации Conda.

if [ -f ~/.condarc ] && rm ~/.condarc

Куда идти дальше?

Теперь, когда вы установили среду Conda и инструмент управления пакетами, вы готовы изучить «передовой опыт» использования Conda для управления средами проектов в области науки о данных. В моем следующем посте я расскажу о том, что я считаю надежным минимальным набором «лучших практик», которые вы можете применить, чтобы получить максимальную отдачу от Conda, когда начнете свой следующий проект в области науки о данных.