NVIDIA Tesla K80

Изчислителни ускорители NVIDIA Tesla са заели своето място навсякъде, където се изискват високи изчислителни характеристики: от анализ на запасите до научни изчисления. Те са оборудвани със специални сървъри, на тяхна база са изградени изчислителни суперклъстери. Тайната на успеха на NVIDIA в тази област е поддръжката на всички съвременни затворени (CUDA) и отворени технологии (OpenCL, DirectCompute). И в една от предишните новини вече съобщихме, че компанията се готви да пусне нови модели ускорители на Tesla, както на базата на новата архитектура на Максуел, така и на базата на изпитаната във времето архитектура на Кеплер. Отделно в този списък беше Tesla K80, който трябваше да стане вторият двупроцесорен ускорител NVIDIA след остарелия D870.

NVIDIA Tesla K80 няма вентилатор

Най-бързият ускорител за научни изчисления

Не без намаляване на тактовите честоти: ядрата на Tesla K80 работят на честота от само 562 MHz в базов режим и 875 MHz в турбо режим. Но в този случай количеството надвишава качеството: почти 5 хиляди потокови процесора, или по-точно 4992, работещи в турбо режим, лесно произвеждат 2,91 терафлопс изчислителна мощност в режим с двойна прецизност. В нормален режим тази цифра спада до 1,87 терафлопса, което все още е повече, отколкото Tesla K40 може да даде в турбо режим (1,66 терафлопса). В същото време картата има стандартно оформление: един слот PCIe x16 и двойна височина, което е необходимо за компактни системи, които обаче изискват висока мощност на обработка. А в режим с една прецизност индикаторите за начинаещи изглеждат още по-впечатляващи: съответно 8,74 и 5,6 терафлопса. Бързата междупроцесорна шина NVLink избягва традиционните NUMA тесни места.

Бързата междупроцесорна шина гарантира, че няма тесни места

Подсистемата памет също не разочарова: на борда на NVIDIA Tesla K80 се инсталират наведнъж 24 гигабайта бърза GDDR5 памет, което е своеобразен рекорд: дори AMD FirePro W9100 има само 16 гигабайта. И това са честните 24 гигабайта, тъй като за разлика от технологията за игри SLI, данните в паметта на първия GPU не трябва да се дублират в блока памет на втория GPU. Трябва ли да обясня, че количеството памет при масивни изчисления играе важна роля? Широчината на честотната лента също не се забравя: общата производителност на подсистемата памет Tesla K80 достига 480 GB/s, 240 GB/s за всеки процесор. Това прави новия продукт идеално решение за почти всяка област, където се изискват масивни изчисления - от астрофизика, генетика и квантова химия, до анализ на големи масиви от данни и системи за "дълбоко машинно обучение". Общо ускорителите на Tesla могат да работят с повече от 280 приложения и софтуерни пакети.