ШІ вітає Linux: вперше в історії Ubuntu 26.10 отримає системний speech-to-text

17 червня директор з інжинірингу десктопного напряму Canonical Жан-Батіст Лалман опублікував на Ubuntu Discourse детальний опис Project Myna — нового застосунку для розпізнавання мовлення, що вийде разом з Ubuntu 26.10 Stonking Stingray у жовтні. Ключова деталь: вся обробка відбувається локально, без підключення до інтернету і без передачі даних на зовнішні сервери.

Читайте также: Sony та Rockstar назвали PlayStation 5 найкращою платформою для гри в GTA 6


Що таке Project Myna

Проєкт названий на честь птаха майна, відомого здатністю уважно слухати та відтворювати людську мову з надзвичайною чіткістю. Так само і застосунок — слухає вашу мову і миттєво перетворює її на точний текст.

Для Ubuntu 26.10 команда свідомо звужує початкову область до базового: надійна десктопна диктовка. Початковий досвід буде простим — натиснути клавіатурне скорочення, говорити природно і бачити, як текст з’являється у застосунку. Myna розроблена для забезпечення розпізнавання мовлення з чіткою візуальною індикацією під час диктовки. “Під капотом” — моделі розпізнавання мовлення, що працюють локально на пристрої користувача.

Як це працює технічно

За лаштунками Myna використовує кілька моделей на вибір.Серед підтримуваних моделей — Whisper від OpenAI, Parakeet від NVIDIA, Nemotron і Qwen3-ASR. Всі вони запускаються локально у вигляді Snap-пакетів. Початковий реліз орієнтований на Ubuntu Desktop з Wayland і GNOME як основним валідованим середовищем — але архітектура навмисно залишається відкритою для підтримки інших десктопних середовищ у майбутньому.


Механізм роботи — push-to-talk: утримуєш клавіатурне скорочення, говориш, відпускаєш. Невеликий індикатор активності відображається під час прослуховування, а розпізнаний текст з’являється там, де стояв курсор на момент початку диктовки.

Приватність як архітектурне рішення

Те, що Canonical обрала локальний підхід — принципово, а не маркетингово.

“Розпізнавання мовлення стало звичайною функцією на сучасних платформах, і ми вважаємо, що воно має бути першокласним досвідом на Ubuntu Desktop — таким, що відчувається як природна частина робочого середовища і водночас поважає приватність користувача та працює повністю на локальному залізі”, — заявив Жан-Батіст Лалман, директор з інжинірингу десктопу Canonical.

Читайте также: Вразливість у FIFA: будь-хто міг зупинити трансляції ЧС-2026 одним кліком

Всі ШI-функції Ubuntu постачатимуться як Snap-пакети, які користувач може видалити так само, як будь-який інший застосунок. Canonical не хоче нав’язувати ШІ — лише зробити його доступним для тих, хто хоче.

Контекст: Linux наздоганяє macOS і Windows

Локальне розпізнавання мовлення — давно стандарт на конкурентних платформах, і Linux тут помітно відставав. Apple Silicon Mac з Voice Control обробляє мову повністю на пристрої і працює без інтернету. Microsoft пропонує Voice Access у Windows 11, замінюючи Windows Speech Recognition, що з’явилося ще у Vista у 2006 році.

Linux до цього часу покладався на сторонні рішення — переважно через браузер або GNOME Shell Extensions — без єдиного системного підходу. Myna має намір заповнити цю прогалину. Показово, що команда Canonical відверто ставить доступність як головну мету, а не демонстрацію ШІ-можливостей заради самого факту.

Що буде далі

Myna — лише перший крок у ширшій AI-стратегії Canonical. Засновник Canonical Марк Шаттлворт прагне позиціонувати Ubuntu як “ОС для агентного AI”. Паралельно з Myna команда розробляє “неявні” ШІ-функції, що працюють у фоновому режимі: покращення фокусування вебкамери та підвищення якості мікрофона через локальні моделі.

Поки що відкритим залишається питання, чи буде Myna увімкнена за замовчуванням у Ubuntu 26.10 або вийде як опційна preview-функція. Рішення Canonical ще не прийняте. Стабільний реліз Ubuntu 26.10 Stonking Stingray запланований на 15 жовтня 2026 року.

Читайте также: Redmi 17C офіційно дебютував: чипсет Helio G81 Ultra, легкий даунгрейд та дуже низька ціна

Джерело: Phoronix

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *