WedX - журнал о программировании и компьютерных науках

Что не так с моим запуском TensorFlow cifar10_multi_gpu_train.py

Моя система:

Linux dl1 3.10.0-229.el7.x86_64 #1 SMP Fri Mar 6 11:36:42 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

и мой графический процессор:

введите здесь описание изображения

Можно запускать образцы моделей, такие как mnist и cifar10 версии с одним GPU. поэтому я думаю, что моя установка tf не проблема.

НО, когда я бегу:

python python cifar10_multi_gpu_train.py --num_gpus=4

Я получил эту ошибку:

ValueError: переменная conv1/weights/ExponentialMovingAverage/ не существует или не была создана с помощью tf.get_variable(). Вы хотели установить reuse=None в VarScope?

29.12.2016

  • добавьте некоторый код, но ошибка, похоже, заключается в том, что вы задали повторное использование параметра при создании переменной. Также может быть, что пример cifar был сделан для старой версии tensorflow, и теперь он не работает из-за изменений в API. Попробуйте с тензорным потоком 0.10 30.12.2016

Ответы:


1

Есть код посмотреть? Я лично думаю, что эта проблема вызвана тем, что вы не использовали повторно общие переменные для разных входных данных в разных графических процессорах, проверьте, находится ли эта строка tf.get_variable_scope().reuse_variables() в вашем цикле для каждого графического процессора.

29.12.2016
  • версия твоего тф? 29.12.2016
  • версия tf 0.12.head 29.12.2016
  • # Повторное использование переменных для следующей башни. tf.get_variable_scope().reuse_variables() 29.12.2016
  • я нашел то, что вы упомянули код, как я могу решить эту проблему 29.12.2016
  • Новые материалы

    Объяснение документов 02: BERT
    BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

    Как проанализировать работу вашего классификатора?
    Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

    Работа с цепями Маркова, часть 4 (Машинное обучение)
    Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

    Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
    Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

    Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
    Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

    Учебные заметки: создание моего первого пакета Node.js
    Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

    Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
    Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


    Для любых предложений по сайту: [email protected]