У четвер Фонд Wikimedia Enterprise оголосив про підписання платних ліцензійних угод з Microsoft, Meta, Amazon, Perplexity та Mistral AI. Це розширює стягнення плати з великих технологічних компаній за використання контенту Вікіпедії для навчання моделей ШІ,які лежать в основі асистентів на кшталт Microsoft Copilot та ChatGPT.
Читайте также: Офіційно: Кетлін Кеннеді йде з Lucasfilm після 14 років роботи з «Зоряними війнами”
Хоча раніше ці ж компанії без дозволу масово збирали дані з Wikipedia, нові угоди означають, що більшість провідних розробників ШІ тепер приєдналися до програми Wikimedia Enterprise — комерційної дочірньої структури фонду, яка продає доступ до API з 65 мільйонами статей Wikipedia на вищих швидкостях і в більших обсягах, ніж безкоштовні публічні API. Фонд не розкрив фінансові умови угод.
Нові партнери приєдналися до Google, який підписав угоду з Wikimedia Enterprise ще у 2022 році, а також до менших компаній, зокрема Ecosia, Nomic, Pleias, ProRata та Reef Media. Отримані доходи допомагають компенсувати інфраструктурні витрати неприбуткової організації, яка в іншому разі покладається на невеликі публічні пожертви, спостерігаючи, як її контент стає базовими навчальними даними для моделей ШІ.
“Wikipedia є критично важливою складовою роботи цих технологічних компаній, і їм потрібно знайти спосіб фінансово її підтримувати. Нам знадобився певний час, щоб зрозуміти, який набір функцій і можливостей варто запропонувати, аби перевести ці компанії з безкоштовної платформи на комерційну, але всі наші партнери з Big Tech чітко усвідомлюють потребу взяти на себе зобов’язання щодо підтримки роботи Wikipedia”, — сказав президент Wikimedia Enterprise Лейн Бекер у коментарі Reuters.
Перехід до платного ліцензування відбувся після багатьох років зростання інфраструктурних витрат, спричинених тим, що компанії зі сфери ШІ масово збирали контент Wikipedia у промислових масштабах. У квітні 2025 року фонд повідомив, що обсяг пропускної здатності, використаної для завантаження мультимедійного контенту, зріс на 50% порівняно із січнем 2024 року. При цьому боти забезпечували 65% найдорожчих запитів до базової інфраструктури, хоча становили лише 35% від загальної кількості переглядів сторінок.
У жовтні Фонд Вікімедіа розкрив, що після оновлення систем виявлення ботів людський трафік на Wikipedia знизився приблизно на 8% у річному вимірі. З’ясувалося, що значна частина відвідувань, які раніше вважалися людськими, насправді була автоматизованими збирачами даних, створеними для обходу детекції. Падіння трафіку загрожує зруйнувати цикл зворотного зв’язку, який підтримував Wikipedia протягом чверті століття: читачі заходять на сайт, частина з них стає редакторами або донорами, і контент поступово покращується.
Читайте также: Мер Нью-Йорка запустив токен, який одразу обвалився на 90%, а інвестори втратили понад $3,4 млн
Нині ж багато чат-ботів і пошукових зведень відповідають на запитання, використовуючи контент Wikipedia, не приводячи користувачів безпосередньо на сайт. Засновник Wikipedia Джиммі Вейлз у коментарі Associated Press заявив, що він загалом вітає навчання моделей ШІ на даних Wikipedia.
“Особисто я дуже радий, що моделі ШІ навчаються на даних Wikipedia, бо вони куровані людьми. Я б не дуже хотів користуватися ШІ, який навчався лише на X — це був би, знаєте, дуже злий ШІ. Але є межа щодо безкоштовного доступу. Компаніям, імовірно, варто скинутися і заплатити свою справедливу частку витрат, які на нас покладають”, — сказав Вейлз.
Тим часом власні експерименти фонду з генеративним ШІ зіткнулися з опором з боку волонтерів-редакторів, які підтримують роботу сайту. У червні Wikipedia призупинила пілотну програму зі створення ШІ-згенерованих резюме статей після того, як редактори назвали її “жахливою ідеєю” та попередили, що вона може підірвати довіру до платформи.
Джерело: Arstecnica.com
Читайте также: В Україні запрацював Samsung Internet: новий ПК-браузер з вбудованим блокувальником реклами