Google “вдарила” по ChatGPT Translate випуском нового відкритого набору ШІ-моделей для перекладу: всього за кілька годин після тихого релізу OpenAI.
Читайте также: «Це вже не моя історія»: Джордж Мартін розповів про «жахливі» стосунки з шоуранером
Сімейство моделей Google TranslateGemma підтримує 55 мов (включно з українською) і доступне у трьох розмірах:
- 4B — для запуску на смартфонах;
- 12B — для ноутбуків;
- 27B — для хмарних серверів.
За основу дослідники взяли Gemma 3 і використали контрольоване точне налаштування (SFT) з різноманітним набором даних — людські переклади та синтетичні від Gemini. Зі слів Google, це дозволило моделям досягти широкого охоплення мов, навіть мов з низьким рівнем ресурсів. Додатково моделі були вдосконалені навчанням з підкріпленням (RL), яке покращило якість перекладу.
Google вимірював якість за допомогою MetricX — метрики, яка відстежує помилки перекладу. Нижчі бали означають менше помилок: з цікавого, TranslateGemma на 12 млрд параметрів отримала 3,60 бали, перевершивши 4,04 бали для базової моделі 27 млрд параметрів (приблизно на 26% менше помилок).
Читайте также: Disciples: Domination вийде через місяць — гра більше нагадує “Героїв”
Новітні моделі штучного інтелекту Google навчені та оцінені на 55 мовних парах, включаючи іспанську, французьку, китайську, хінді та інші. Компанія також навчила модель майже на 500 додаткових мовних парах. Примітно, що окрім прямого перекладу тексту, ШІ також приймає зображення як вхідні дані та може розпізнавати та перекладати текст зі сканів, скриншотів, фото тощо.
Моделі TranslateGemma доступні для завантаження на Kaggle та Hugging Face.
Джерело: Google
Читайте также: «Лицар Сімох Королівств»: пригоди, честь та дружба за 90 років до «Гри престолів»