Публикации по теме 'deep-learning'
Как работают вложения предложений, часть 3 (машинное обучение)
Линейное межъязыковое сопоставление вложений предложений (arXiv)
Автор : Олег Васильев , Фумика Исоно , Джон Боханнон .
Аннотация: Семантика предложения определяется с гораздо меньшей неоднозначностью, чем семантика отдельного слова, и она должна лучше сохраняться при переводе на другой язык. Если многоязычные вложения предложений предназначены для представления семантики предложений, то сходство между вложениями любых двух предложений должно быть инвариантным по отношению к..
Классификация изображений с использованием глубоких нейронных сетей - удобный для новичков подход с использованием TensorFlow
tl;dr
Мы построим глубокую нейронную сеть, которая сможет распознавать изображения с точностью 78,4%, объясняя при этом методы, используемые на протяжении всего процесса.
Вступление
Последние достижения в области глубокого обучения сделали возможными такие задачи, как распознавание изображений и речи.
Глубокое обучение: подмножество алгоритмов машинного обучения, которое очень хорошо распознает шаблоны, но обычно требует большого количества данных.
Глубокое обучение превосходно..
Как используются слои нормализации, часть 2 (машинное обучение)
Начало работы с нормализацией слоя
Документы с кодом — объяснение нормализации слоев В отличие от пакетной нормализации, нормализация слоев напрямую оценивает статистику нормализации из суммированных входных данных… paperswithcode.com
1. О нормализации слоев и остаточных соединениях в Transformers (arXiv)
Автор: Сё Такасэ , Сюн Киёно , Сосуке Кобаяши , Джун Судзуки
Аннотация: С точки зрения нормализации уровня (LN)..
Работа с гипотезой лотерейного билета, часть 1 (машинное обучение)
Гипотеза лотерейного билета для Vision Transformers (arXiv)
Автор: Сюань Шэнь , Чжэнлунь Конг , Минхай Цинь , Пейян Дун , Гэн Юань , Синь Мэн , Хао Тан , Сяолун Ма , Янжи Ван
Аннотация . Обычная гипотеза лотерейного билета (LTH) утверждает, что существует разреженная подсеть внутри плотной нейронной сети и надлежащий метод случайной инициализации, называемый выигрышным билетом, такой, что его можно обучить с нуля до почти так же хорош, как плотный аналог. Между тем..
Визуальное объяснение трансформаторов (часть 2): как это работает, шаг за шагом
ИНТУИТИВНЫЕ ТРАНСФОРМАТОРЫ СЕРИИ NLP
Визуальное объяснение трансформаторов (часть 2): как это работает, шаг за шагом
Нежное руководство по трансформатору под капотом и его непрерывной эксплуатации.
Это вторая статья из моей серии о трансформерах. В первой статье мы узнали о функциональности Transformers, о том, как они используются, об их высокоуровневой архитектуре и их преимуществах.
В этой статье мы теперь можем заглянуть под капот и подробно изучить, как они работают. Мы..
Краткая история глубокого обучения
Человеческие изобретения черпают вдохновение в природе. Точно так же глубокое обучение было попыткой смоделировать человеческий мозг, одну из самых сложных структур во Вселенной. Попытка не заключалась в том, чтобы имитировать каждую деталь мозга. Вместо этого искусственные нейронные сети были вдохновлены биологическими нейронными сетями, что в конечном итоге привело к глубокому обучению.
Так что же такое глубокое обучение?
Google определяет глубокое обучение как «тип машинного..
Глубокое обучение прогнозированию сроков доставки клиентам (CDT) — практический подход
Электронная коммерция сильно повлияла на то, как мы покупаем товары и услуги. Это может быть связано с различными факторами, такими как — удобная доставка заказа на дом в нужное время ( например, 10:00–10:30), возможность просмотра и поиска в огромном каталоге товаров. в несколько кликов, скидки, распродажи и т. д. и т. д. . В этой статье мы даем общий обзор процесса доставки и того, как мы используем машинное обучение для лучшей оценки времени доставки клиенту (CDT). CDT влияет на..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..