Щойно на конференції Google Cloud Next ’26 у Лас-Вегасі Google представила восьме покоління власних процесорів — Tensor Processing Units. Обидва чіпи розроблені у партнерстві з Google DeepMind і будуть загальнодоступні пізніше цього року як частина платформи AI Hypercomputer.
Читайте также: Серіал “Гаррі Поттер” від HBO: ближче до книг, але фанати розлючені через зміни
На відміну від попередніх поколінь, TPU 8 уперше розділений на два спеціалізовані чіпи з принципово різними архітектурами: TPU 8t для тренування моделей і TPU 8i для інференсу. TPU 8t (кодова назва Sunfish, розроблений разом із Broadcom) орієнтований на тренування великих моделей. Він масштабується до 9 600 чіпів у єдиному суперподі з 2 петабайтами спільної високопропускної пам’яті та досягає 121 ексафлопа продуктивності у форматі FP4.
Нова архітектура міжчіпових з’єднань дозволяє Google за допомогою фреймворків JAX і Pathways масштабуватись до понад мільйона TPU в одному тренувальному кластері. Показник продуктивності на ват зріс удвічі порівняно з попереднім поколінням Ironwood. Окрема інновація — TPUDirect RDMA, що забезпечує пряму передачу даних між пам’яттю та мережевими картами в обхід CPU, суттєво знижуючи затримки.
TPU 8i (кодова назва Zebrafish, розроблений разом із MediaTek) оптимізований для інференсу та агентних навантажень. Він масштабується до 1 152 чіпів у єдиному поді, досягає 11,6 ексафлопа продуктивності FP8 і містить утричі більше вбудованої пам’яті SRAM порівняно з попередньою версією — для зберігання великих KV-кешів безпосередньо на кристалі.
Читайте также: Стала відома дата прем’єри 3 сезону “Володаря перснів: Персні влади”
За даними Google, TPU 8i забезпечує на 80% кращу продуктивність на долар порівняно з Ironwood, що робить його придатним для одночасного запуску мільйонів агентів у промисловому масштабі. Обидва чіпи використовують Axion ARM-процесор як хост і підтримують рідинне охолодження.
Паралельно Google анонсувала мережеву інновацію Virgo Network — нову архітектуру для дата-центрів, що забезпечує до 47 петабіт за секунду пропускної здатності та здатна об’єднувати понад 134 000 чіпів TPU 8t в єдину тренувальну інфраструктуру. Нова система зберігання Managed Lustre тепер забезпечує 10 ТБ/с пропускної здатності для TPU 8t через RDMA.
Варто зазначити, що Google веде активну боротьбу за ринок ШІ-прискорювачів із NVIDIA. За даними аналітиків, Anthropic вже підписала угоду на використання до мільйона TPU від Google, а Meta уклала багаторічний багатомільярдний контракт на доступ до хмарної TPU-інфраструктури Google Cloud. Як ми писали раніше, саме на TPU навчається Gemini 3.1 Pro — модель, яка у лютому 2026 року посіла перше місце у 12 бенчмарках серед конкурентів.
Читайте также: Перша велика проблема Джона Тернуса у Apple — це ШІ
Джерело: Google