Що стосується графічних процесорів, Nvidia є провідним експертом. Працюючи в бізнесі з 1993 року, Nvidia випустила широкий асортимент високоякісних професійних і споживчих графічних процесорів. Пошанована архітектура їх процесорів стоїть за успіхом їх продукту, особливо первинної лінійки, GeForce. Графічні процесори Nvidia вийшли за межі ігрового простору, розширивши свою присутність у глибокому навчанні, AI (Штучний інтелект) та прискорену аналітику. Nvidia проникла на ринок дата-центрів десять років тому, починаючи з чіпів Fermi. Були зроблені наступні ітерації, і компанія постійно випускала графічні процесори, які заповнювали ненаситний попит на більш швидку швидкість обробки в центрах обробки даних. Графічні процесори Nvidia еволюціонували протягом багатьох років, і архітектурні проекти в першу чергу рухають еволюцію.
Архітектура Ампера від Nvidia
Конкуренція між виробниками графічних процесорів є серйозною, але Nvidia не стримує нічого, щоб зайняти перше місце. Фактично, Nvidia домінувала на ринку штучного інтелекту протягом останнього десятиліття. У 2020 році новина про перший 7-нм графічний процесор Nvidia (8 нм для споживчих деталей) з 54 мільярдами транзисторів, стиснених у такий маленький штамп, викликала неабиякий кайф. Під кодовою назвою Ампер після французького математика Андре-Марі Ампера, Архітектура процесора Nvidia суттєво вдосконалюється в порівнянні зі своїми попередниками, Тьюрінгом та Вольтою, обіцяючи більше функціональних можливостей, кращу ефективність та вищу продуктивність при нижчих рівнях потужності. Ampere стоїть за другим поколінням графічних процесорів RTX від Nvidia, серія RTX 30, і, як кажуть, вона вдвічі швидша за аналоги з серії RTX 20. Архітектура Ampere також є силою графічних процесорів центру обробки даних Nvidia A100.
Технічні характеристики Ампера
Ampere - це перший графічний процесор Nvidia 7 нм / 8 нм, друге покоління трасування споживчих променів і має третє покоління тензорних ядер. Ampere - це основна архітектура графічних процесорів GA100, GA102 та GA104, які вбудовані в GeForce RTX 3090, RTX 3080, RTX 3070 і зовсім недавно RTX 3060. Nvidia також планує випустити RTX 3050 у наступні місяці. Тим часом корпоративний графічний процесор GA100 забезпечує в 20 разів більше обчислювальної потужності, ніж попередні покоління графічних процесорів центрів обробки даних. Ось огляд професійних та споживчих графічних процесорів на базі Ampere від Nvidia [1]:
Графічний процесор | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Відеокарта | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Процес (нм) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Транзистори (млрд) | 54 | 28.3 | 28.3 | 17.4 |
Розмір штампу (мм ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
Конфігурація GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
СМС | 108 | 82 | 68 | 46 |
Ядра CUDA | 6912 | 10496 | 8704 | 5888 |
Ядра RT | Жоден | 82 | 68 | 46 |
Ядра тензора | 432 | 328 | 272 | 184 |
Частота посилення (МГц) | 1410 | 1700 | 1710 рік | 1730 рік |
Швидкість VRAM (Гбіт / с) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (ГБ) | 40 (48 макс.) | 24 | 10 | 8 |
Ширина автобуса | 5120 (6144 макс.) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 рік | 35686 | 29768 | 20372 |
RT TFLOPS | Не застосовується | 69 | 58 | 40 |
Тензор TFLOPS FP16 (розрідженість) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Пропускна здатність (ГБ / с) | 1555 рік | 936 | 760 | 448 |
TBP (Вт) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 - це перший графічний процесор, який використовував архітектуру Ампера. Корпоративний чіп орієнтований на центри обробки даних і призначений для інтенсивних графічних процесів, таких як глибоке навчання та AI. Побудований за допомогою 7-нм процесу TSMC, він містить величезну кількість 54 мільярдів транзисторів. Він перевершив попередні покоління корпоративних графічних процесорів завдяки збільшенню продуктивності в 20 разів завдяки 6 912 ядрам CUDA, 432 одиниці відображення текстур, 160 ROP, ядрам Tensor третього покоління та 40 ГБ VRAM з пропускною здатністю пам'яті, яка досягає 1.6 ТБ / сек. DGX A100 - це перша у світі система штучного інтелекту з кластером з восьми A100 і вагомою ціною в 199 000 доларів.
Серія GeForce RTX 30
Окрім домінування на корпоративному ринку, Nvidia завжди має на увазі споживачів, особливо геймерів та творців. Архітектура Ampere також прийнята на споживчих відеокартах Nvidia. Друге покоління GeForce RTX оснащено графічними процесорами на базі Ampere, що підвищує продуктивність удвічі більше, ніж попереднє покоління.
У більшості аспектів Ампер має більш ніж подвійну обчислювальну здатність Тьюрінга. Він подвоїв продуктивність шейдерів Тьюрінга з подвоєною кількістю ядер FP32 CUDA. Зокрема, він має 30 Shader-TFLOPS, 2.У 7 разів більше, ніж у Тьюрінга, що становить лише 11 шейдер-TFLOPS. Подібним чином, Тенсорське ядро тензора вимірює 89 Тензор-TFLOPS, але Ампер збільшив цей показник більш ніж удвічі зі своїми 238 Тензор-TFLOPS. Не можна забувати і про його швидкість Core Tracing Core, яка становить 58 RT-TFLOPS, 1.У 7 разів швидше, ніж 34 RT-TFLOPS Тьюрінга, а для того, щоб графічні процесори працювали ще швидше, чіп Ampere підключається до найшвидшої в світі пам'яті, Micron G6X.
Серія RTX 30 виготовлена з використанням Samsung 8N Nvidia Custom Process з 28 мільярдами транзисторів для GA102 і 17 мільярдами транзисторів для GA104. Клас Titan RTX 3090 оснащений графічним процесором GA102 і забезпечує надзвичайно потужну продуктивність споживчих карт. На відміну від попередніх поколінь, RTX 3090 відкритий для третіх сторін для індивідуального дизайну.
RTX 3080 також використовує графічний процесор GA102, забезпечуючи вдвічі більшу продуктивність, ніж RTX 2080, і вражаючу ігрову майстерність 4K. RTX 3070, що працює на графічному процесорі GA104, є рівним RTX 2080 Ti за половину ціни. Нещодавно випущений RTX 3060 також ніколи не вражає своєю приголомшливою продуктивністю завдяки вдосконаленим ядрам трасування Ray, ядрам Tensor, новим потоковим мультипроцесорам та високошвидкісній пам'яті G6.
Незважаючи на значне збільшення продуктивності, нові графічні процесори RTX не важкі. Набагато швидші графічні карти легко доступні, коли мова заходить про ціни. Флагман Nvidia GeForce, RTX 3080, починається з 699 доларів, RTX 3070 продається за 499 доларів, а RTX 3060 має ціну в 329 доларів. RTX 3090 вищого класу коштує 1499 доларів; все ще значно недорогий, враховуючи його продуктивність на рівні Titan.
Як повідомляється, буквально через кілька місяців після його випуску бракувало відеокарт на базі Ампера, і це не дивно, що приголомшлива продуктивність Ампера за розумною ціною. Для тих, хто розглядає можливість оновлення графічного процесора, зараз найкращий час взяти в руки графічні процесори на базі Ampere від Nvidia.
Джерела
[1] Уолтон, Джарред. “Глибоке занурення в архітектуру Ampere 30-серії Nvidia RTX: все, що ми знаємо”. https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 13 жовтня 2020 р.