Google більше не змушує обирати між TPU і NVIDIA: названа дата виходу нового Vera Rubin NVL72

На конференції Google Cloud Next ’26 у Лас-Вегасі компанія підтвердила: у другій половині 2026 року Google Cloud стане першим хмарним провайдером, що запропонують клієнтам доступ до NVIDIA Vera Rubin NVL72 — стійкового ШІ-суперкомп’ютера нового покоління.

Читайте также: Google Cloud і NASA: агенти Gemini забезпечили безпеку місії Artemis II — ITC.ua


Системи будуть інтегровані в архітектуру AI Hypercomputer і доступні через нову лінійку інстансів A4 Ultra. Попередній доступ відкривається у регіонах us-central1 та europe-west4 з другого кварталу 2026 року.

Vera Rubin NVL72 — флагманська конфігурація нової платформи NVIDIA Rubin, офіційно представленої на CES 2026 у Лас-Вегасі. Стійка об’єднує 72 GPU Rubin і 36 процесорів Vera CPU, пов’язаних між собою міжз’єднанням NVLink 6 шостого покоління із загальною пропускною здатністю 260 ТБ/с — за твердженням NVIDIA, це більше, ніж сукупна пропускна здатність усього публічного інтернету. Кожен GPU Rubin побудований на 336 мільярдах транзисторів і забезпечує до 50 петафлопів інференсу у форматі NVFP4 — у п’ять разів більше, ніж Blackwell. Загальний обсяг пам’яті HBM4 у стійці — 20,7 ТБ.

Ключова перевага нової платформи — різке зниження вартості інференсу. NVIDIA заявляє про 10-кратне зниження вартості токена порівняно з Blackwell і вчетверо меншу кількість GPU для тренування моделей типу Mixture-of-Experts тієї самої потужності. Крім того, стійка повністю безвентиляторна, безкабельна і охолоджується виключно рідиною — час складання скоротився з двох годин у Blackwell до п’яти хвилин. Уже у першому кварталі 2026 року NVIDIA підтвердила, що Vera Rubin перебуває у повному виробництві.

Читайте также: Xbox Game Pass стане гнучкішим — Microsoft розглядає формат pick your own plan


“Ми позиціонуємо цей крок як стратегічний відхід від виключної ставки на власні TPU: платформа AI Hypercomputer тепер пропонує гетерогенну інфраструктуру — TPU 8-го покоління для JAX-нативних навантажень і Vera Rubin NVL72 для великомасштабного тренування в екосистемі CUDA”, — пише Google.

Доступ до Vera Rubin у другій половині 2026 року також планують AWS, Microsoft Azure та Oracle Cloud, однак Google стала першим із великих провайдерів, хто офіційно підтвердив інтеграцію платформи у власну ШІ-архітектуру — AI Hypercomputer.

Як ми писали раніше, Google вже анонсувала восьме покоління власних TPU — два окремі чіпи TPU 8t і TPU 8i, що забезпечують до 80% кращу продуктивність на долар у сфері інференсу порівняно з попереднім поколінням. Поява Vera Rubin NVL72 в портфоліо Google Cloud означає, що компанія більше не змушує клієнтів обирати між власною і NVIDIA-архітектурою — обидві будуть доступні в межах єдиної платформи.

Читайте также: Борис Тизенгаузен Биография Личная Жизнь: Карьера и Личность

Джерело: Google Cloud

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *