Удвічі ефективніше, утричі більше пам'яті: Google представила нові TPU 8 покоління

Щойно на конференції Google Cloud Next ’26 у Лас-Вегасі Google представила восьме покоління власних процесорів — Tensor Processing Units. Обидва чіпи розроблені у партнерстві з Google DeepMind і будуть загальнодоступні пізніше цього року як частина платформи AI Hypercomputer.

На відміну від попередніх поколінь, TPU 8 уперше розділений на два спеціалізовані чіпи з принципово різними архітектурами: TPU 8t для тренування моделей і TPU 8i для інференсу. TPU 8t (кодова назва Sunfish, розроблений разом із Broadcom) орієнтований на тренування великих моделей. Він масштабується до 9 600 чіпів у єдиному суперподі з 2 петабайтами спільної високопропускної пам’яті та досягає 121 ексафлопа продуктивності у форматі FP4.

Нова архітектура міжчіпових з’єднань дозволяє Google за допомогою фреймворків JAX і Pathways масштабуватись до понад мільйона TPU в одному тренувальному кластері. Показник продуктивності на ват зріс удвічі порівняно з попереднім поколінням Ironwood. Окрема інновація — TPUDirect RDMA, що забезпечує пряму передачу даних між пам’яттю та мережевими картами в обхід CPU, суттєво знижуючи затримки.

TPU 8i (кодова назва Zebrafish, розроблений разом із MediaTek) оптимізований для інференсу та агентних навантажень. Він масштабується до 1 152 чіпів у єдиному поді, досягає 11,6 ексафлопа продуктивності FP8 і містить утричі більше вбудованої пам’яті SRAM порівняно з попередньою версією — для зберігання великих KV-кешів безпосередньо на кристалі.

За даними Google, TPU 8i забезпечує на 80% кращу продуктивність на долар порівняно з Ironwood, що робить його придатним для одночасного запуску мільйонів агентів у промисловому масштабі. Обидва чіпи використовують Axion ARM-процесор як хост і підтримують рідинне охолодження.

Паралельно Google анонсувала мережеву інновацію Virgo Network — нову архітектуру для дата-центрів, що забезпечує до 47 петабіт за секунду пропускної здатності та здатна об’єднувати понад 134 000 чіпів TPU 8t в єдину тренувальну інфраструктуру. Нова система зберігання Managed Lustre тепер забезпечує 10 ТБ/с пропускної здатності для TPU 8t через RDMA.

Варто зазначити, що Google веде активну боротьбу за ринок ШІ-прискорювачів із NVIDIA. За даними аналітиків, Anthropic вже підписала угоду на використання до мільйона TPU від Google, а Meta уклала багаторічний багатомільярдний контракт на доступ до хмарної TPU-інфраструктури Google Cloud. Як ми писали раніше, саме на TPU навчається Gemini 3.1 Pro — модель, яка у лютому 2026 року посіла перше місце у 12 бенчмарках серед конкурентів.

Джерело: Google

Sony підозрюють у використанні ботів для захисту від критики через відмову від дисків

Відомий консерватор Бен Шапіро назвав “Одіссею” шедевром попри сумнівний кастинг Елліота Пейджа

У Нью-Йорку розпочато будівництво надвисокого хмарочосу Всесвітнього торгового центру №2

MacBook Neo такого не запропонує: Lenovo випустила бюджетний ноутбук з 32 ГБ ОЗП та 1 ТБ пам'яті

Ваш наступний iPhone може мати дві батареї: що означає знахідка в iOS 27 beta

Маппети, Трамп із медаллю і Парадес за горло: деталі фіналу, які не потрапили в основний репортаж

Удвічі ефективніше, утричі більше пам'яті: Google представила нові TPU 8 покоління

Залишити відповідь Скасувати коментар

Залишити відповідь Скасувати коментар

Пов'язані новини