Хто насправді контролює ваш пошук: чому Reddit опиняється вище експертних сайтів у видачі Google

Ми додаємо слово “Reddit” у кінець пошукового запиту, тому що не довіряємо десяти сторінкам із добірками “найкращого”, які завантажуються першими. А останнім часом навіть не потрібно цього робити. Reddit уже там — вище за людей, які написали статті, протестували продукти або провели журналістське розслідування.

Читайте также: “Серце Звіра”: Бред Пітт виживає на Алясці з бойовим псом, дивимося трейлер українською


Саме в цьому полягає реальна проблема, з якою дедалі частіше стикається сучасний веб: гігантські платформи живляться оригінальною роботою, анонімні незнайомці просуваються як абсолютні носії істини заради своїх величезних платформ, а невеликим видавцям кажуть продовжувати створювати контент, хоча всі причини для його створення поступово забирають. Тож, це про Reddit. Але це також про Google. А найбільше — про ще одну корпоративну “вузьку горловину”, яка дедалі сильніше стискає інтернет.

Офіційне пояснення Google звучить розумно, але не витримує перевірки власними правилами

Google почала віддавати перевагу людським обговоренням і особистому досвіду, тому що люди втомилися від SEO-сміття. Від тих сторінок на кшталт “ми протестували 47 блендерів”, де насправді не протестували жодного, і кулінарних блогів, які змушували вас читати історію чийогось дитинства перед тим, як дати рецепт. Reddit, найбільше сховище людських дискусій в інтернеті, переміг.

“Акуратне пояснення і, ймовірно, частково правдиве. Але воно не відповідає власним задекларованим цінностям Google. Уже багато років Google проповідує принцип E-E-A-T: досвід, експертність, авторитетність і надійність. Саме навколо цієї концепції видавці перебудовували свою роботу, додаючи біографії авторів, підтвердження кваліфікації та опис особистого досвіду. Логіка проста: якщо у вас немає підтвердженої історії роботи з певною темою, ваш контент ранжуватиметься нижче за контент людини, яка таку історію має”, — зазначає MakeUseOf.

За цими стандартами анонімна гілка на Reddit не повинна випереджати експертні сайти. Але Google все одно просуває Reddit, тому що він вважається більш “справжнім” і “людяним”.


Google заплатив Reddit $60 млн, натомість отримавши доступ до даних для навчання ШІ

Ми пишемо тут “ШІ”, мається на увазі LLM — велику мовну модель. Велика мовна модель працює з текстом, щоб генерувати новий текст. Подумайте, скільки сьогодні існує детекторів ШІ. Тексти ШІ звучать як тексти ШІ, тому що вони написані ШІ, а не людиною. Це небажано, і компанії, звісно, хочуть, щоб їхні моделі звучали більш “по-людськи”.

“Якби ви хотіли навчити ШІ звучати більш людяно, ви б використовували класичну літературу з відкритим доступом чи реальні сучасні розмови? Припускаємо, що другий варіант. Якщо так, то Reddit є золотою жилою саме такого типу даних”, — каже MakeUseOf.

22 лютого 2024 року Google і Reddit оголосили про угоду вартістю приблизно $60 млн на рік. Google отримала структурований доступ у режимі реального часу до всього потоку даних Reddit для навчання Gemini та покращення Пошуку. Reddit отримав гроші та доступ до інструментів ШІ від Google. Якщо скласти ці два факти разом, напрошується очевидний висновок: Google хотіла отримати дані Reddit і заплатила решту ціни пошуковими позиціями. Просування Reddit збільшує трафік на Reddit, що генерує більше даних для навчання моделей Google. Усі виграли.

Не все так просто

Є й очевидне заперечення — питання часу. Видимість Reddit у Google зросла на 1328% між серединою 2023 року та початком 2024 року, тобто ще до офіційного оголошення угоди. Контракт, підписаний у лютому 2024 року, не міг спричинити сплеск, який почався ще у 2023 році. Але 22 лютого — це дата, коли про угоду дізналася громадськість, а не коли її уклали. Reddit уже повідомляв про партнерство потенційним інвесторам перед IPO, описуючи угоду з пошуковим провайдером, укладену “раніше того року”. Стрімке зростання та угода збігаються значно точніше, ніж може здатися з дати оголошення.

“Потім, у липні 2024 року, Reddit заблокував Bing, DuckDuckGo та іншим пошуковим роботам індексацію свіжого контенту — і залишив Google осторонь цих обмежень”, — зауважує MakeUseOf.

Читайте также: Intel Graphics 2 Xe3 виявилась на 26% повільнішою за AMD Radeon 840M

Microsoft підтвердила, що Bing перестав отримувати актуальні результати з Reddit. Єдиною іншою пошуковою системою, яка все ще показує свіжі гілки Reddit, залишається Kagi, яка використовує індекс Google. Reddit стверджує, що це не мало жодного стосунку до угоди. Можливо. Але результат однаковий у будь-якому випадку: Google тепер має майже ексклюзивний доступ до свіжого контенту Reddit як для Пошуку, так і для навчання ШІ.

Проблема не в Reddit

Коли ми хочемо дізнатися, чи працює гра на Steam Deck, або намагаємося вирішити якусь рідкісну програмну помилку, гілка коментарів від незнайомців часто виявляється кращою за вилизану статтю. У багатьох випадках Reddit справді є правильною відповіддю. Але Reddit — це не весь інтернет, і Google дедалі частіше поводиться так, ніби це саме так. Це створює дві проблеми, і лише одна з них пов’язана з моїми почуттями.

“Перша проблема — стимули. Їх забирають у авторів статей. Ніхто вже не хоче писати найкращий гайд або огляд, тому що неважливо, наскільки хорошим буде мій матеріал — він не переможе Reddit”, — стверджує MakeUseOf.

Друга проблема — та сама, яку Google нібито намагається вирішити. Уся логіка просування Reddit полягає в тому, що він нібито більш справжній, людяний і надійний, ніж сторінка, створена заради SEO. Добре. Але якщо один коментар на Reddit може випередити спеціалізоване видання, тоді маркетолог, конкурент або ферма ботів матимуть усі підстави на світі, щоб захопити цю гілку. Написати “Я колишній інженер Microsoft” нічого не коштує.

Це не вперше: Google вже має історію просування того, що належить їй або за що вона платить

Yelp створив найповнішу базу відгуків про локальний бізнес в інтернеті. Потім Google Maps став достатньо хорошим сервісом, і Google почала показувати власні відгуки на вершині майже кожного локального пошуку. Трафік Yelp обвалився. Відтоді компанія сперечається з Google в судах і перед регуляторами.

“Те саме сталося і в туристичній сфері. Kayak, Skyscanner та TripAdvisor роками будували інструменти для пошуку авіаквитків і готелів, якими люди реально користувалися. Потім Google сама стала пошуковиком для авіаперельотів і готелів, розмістила власний сервіс на вершині результатів, а незалежні гравці миттєво втратили верхню частину воронки трафіку”, — додає MakeUseOf.

Сценарій щоразу однаковий. Google знаходить категорію, де сторонні сайти привертають увагу користувачів. Потім Google або створює власну версію сервісу, або купує її, або, як у випадку з Reddit, укладає угоду з домінуючим гравцем. Після цього відповідний результат починає просуватися вище за незалежні проєкти, які свого часу створили саму категорію. Незалежні учасники не були присутні за столом переговорів, коли укладалися ці домовленості, і не мають засобів впливу вже після цього.

Reddit позиціонує себе як “найсправжніше місце в інтернеті”, і ось результат

Reddit — це лише чергова ітерація. Google відкрито заявляла про одну річ: її пошук на базі ШІ працює за тими самими принципами ранжування, що й звичайний пошук. Тож у міру того, як AI Overviews та AI Mode перебирають на себе дедалі більшу частину того, як люди знаходять інформацію, діє та сама логіка. Контент Reddit потрапляє до індексу. Контент Reddit навчає модель. Контент Reddit з’являється у відповіді.

Старий веб справді мав проблему. Так, SEO-сміття існувало, і воно заслужено програло. Але рішення, яке обрала Google, не виправило ситуацію. Як і в багатьох інших речах у сучасному світі, корпорації враховують інтереси споживачів лише тоді, коли це збігається з їхніми власними інтересами. Цього разу Google знову перенаправляє інтернет від людей, які його створювали, до тих, із ким цього разу уклала угоду сама Google.

Читайте также: Halo Studios показала 28 хвилин геймплею і повне проходження Assault on the Control Room


Джерело: MakeUseOf

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *