NVIDIA DGX-1 для глубоко обучаемых систем содержит 8 GPU Pascal Tesla P100

Прeдыдущиe GPU нa aрxитeктурe Maxwell в вычислeнияx с двoйнoй тoчнoстью были нeвeрoятнo слaбы, тaк чтo нa грaфичeскиx прoцeссoрax GM200 прoдукт пoд брeндoм Tesla вышeл тoлькo пoд кoнeц прoшлoгo гoдa и мoг пoxвaстaться прoизвoдитeльнoстью FP64 aж 0,21 тeрaфлoпс. Тaк вoт ты кaкoй, Скaйнeт! Нoвинкa Tesla P100 в aктуaльнoй кoнфигурaции нa oпeрaцияx с двoйнoй тoчнoстью выдaёт приличныe 5,3 тeрaфлoпсa и дoстoйнa нaзывaться ускoритeлeм вычислeний. Кoмпaния NVIDIA рaзгулялaсь нe нa шутку. Тeм самым решение может себя показать с сильной стороны как в вычислениях с одинарной точностью, так и с двойной. Представлен новый чип, который имеет превосходное по современным меркам соотношение 32-разрядных и 64-разрядных блоков — 2:1. В первом случае гарантируется также работа с половинной точностью.

Подобная производительность оказалась востребованной для создания самообучающихся систем на базе нейронных сетей. Возник спрос на системы для так называемого глубокого обучения, когда системе скармливают серии изображений и учат идентифицировать объекты. Решения на Maxwell хорошо справлялись с подобными задачами, но Pascal Tesla P100 будет учиться ещё быстрее. Это сравнительно новый тренд. В то же время GPU Pascal Tesla P100 остаётся силён под нагрузкой вычислениями с одинарной и половинной точностью.

Общая производительность системы DGX-1 на вычислениях с половинной (FP16) точностью будет достигать 170 терафлопс. Именно для систем с глубоким обучением NVIDIA представила полочный вариант компьютера NVIDIA DGX-1 на базе восьми модулей с GPU Pascal Tesla P100. Каждый из 8 GPU поддержан 16 Гбайт памяти HBM 2. Один такой компьютер, по словам NVIDIA, заменит 250 двухпроцессорных полочных ПК на базе моделей Intel Xeon. Согласитесь, это впечатляет.

Пиковое потребление — 3,2 КВт. на процессоры и $500 тыс. Для кэширования данных в систему встроен SSD ёмкостью 7 Тбайт. В США система NVIDIA DGX-1 будет продаваться с июня. Ожидаемая цена решения — $129 тыс. В остальных странах новинка появится с третьего квартала. В решении впервые для связи графических процессоров использован новый интерфейс компании — NVLink. Высота блока — 3U. Сетевой интерфейс — два порта 10GbE и четыре InfiniBand 100Gb. на сетевую обвязку. Если собирать «аналог» на процессорах Intel Xeon, как подсчитали в компании, то понадобится $2,5 млн.

Комментарии и уведомления в настоящее время закрыты..

Комментарии закрыты.