WedX - журнал о программировании и компьютерных науках

Двойная точность Тесла

Я ищу информацию о том, как аппаратно реализована двойная точность в GPU tesla. Я читал, что два потоковых процессора работают на одном двойном значении, но я не нашел официального документа от nvidia.

Заранее спасибо. PPS Почему большинство графических процессоров вычисляют только с одинарной точностью (потому что цвета могут храниться как RR.GG.BB.TT, где каждый символ представляет собой 8-битное значение)?

PS погуглил, не помогло

11.08.2010

Ответы:


1

Отсутствие поддержки double связано не с форматом хранения, как вы сказали (RR.GG.BB.TT), а с наличием собственных встроенных функций (и, следовательно, выделенного оборудования) для обработки операций с double (add, mul, madd и т. д.).

В любом случае, большинство графических процессоров поддерживает только одинарную точность, потому что большая часть рынка графических процессоров приходится на игровой рынок, а геймерам не нужна двойная точность. Также большинство геймеров ищут хорошее соотношение цена/качество. Реализация DP обходится дорого с точки зрения бюджета транзистора (и TDP), и если игры не используют двойную точность, это бессмысленно.

Вот почему вы видите высокопроизводительные графические процессоры ATI, поддерживающие двойные (HD 59xx и HD 58xx, но не графические процессоры среднего и начального уровня, такие как HD 57xx и меньше).

@karlphillip: Да, вы правы, IEEE754 (вроде) для графических процессоров, таких как GTX 260, но текущее поколение ATI и NVIDIA поддерживает IEEE 754-2008 для высококачественных компонентов.

Что касается аппаратной реализации, это секреты, которые IHV обычно не рассказывают :)

11.08.2010

2

Tesla — это не графический процессор, это линейка сопроцессоров с различными высокопроизводительными графическими процессорами. Если внутри вашего Tesla установлен графический процессор Fermi, он должен иметь хорошую производительность с двойной точностью.

См. белую книгу Fermi, стр. 9.

Одинарная точность более важна для обычных вычислений на GPU, поскольку ее достаточно для таких приложений.

11.08.2010

3

Согласно Wiki:

Для двойной точности (поддерживается только в более новых графических процессорах, таких как GTX 260[12]) существуют некоторые отклонения от стандарта IEEE 754: округление до ближайшего четного — единственный поддерживаемый режим округления для обратного, деления и квадратного корня. . В одинарной точности денормализация и сигнальные значения NaN не поддерживаются; поддерживаются только два режима округления IEEE (прерывание и округление до ближайшего четного), и они указываются для каждой инструкции, а не в контрольном слове; а точность деления/извлечения квадратного корня немного ниже одинарной точности.

Ну вот, они реализуют большую часть спецификации IEEE 754, но фактическая реализация, вероятно, частные и секретные.

11.08.2010
Новые материалы

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..


Для любых предложений по сайту: [email protected]