Метка: Пейволи

  • ШІ-браузери обходять пейволи на сайтах без жодних допоміжних інструментів

    ШІ-браузери обходять пейволи на сайтах без жодних допоміжних інструментів

    Журналісти виявили, що нові ШІ-браузери, на кшталт Atlas від OpenAI та Comet від Perplexity , з легкістю обходять пейволи — сторінки на сайтах, доступні читачам лише за платним доступом.

    Для цього не потрібно використовувати жодних додаткових інструментів, достатньо просто попросити ШІ-браузер надати повний зміст статті. В експерименті Columbia Journalism Review , браузери Atlas та Comet на запит журналістів запросто представили ексклюзивний для передплатників текст на 9 тисяч слів від MIT Technology Review. Тоді як в стандартних інтерфейсах ChatGPT та Perplexity, чатботи відповіли, що не можуть отримати доступ, оскільки їхні сканери заблоковані там.

    Річ у тім, що для сайтів Atlas та Comet не відрізняються від людини, яка використовує стандартний браузер Chrome. Звичайні автоматизовані системи, такі як краулери та парсери, проявляють себе за допомогою цифрового ідентифікатора, який повідомляє сайту, яке програмне забезпечення робить запит і яка його мета. Видавці можуть вибірково блокувати певні сканери за допомогою протоколу виключення ботів (Robots Exclusion Protocol).

    “Оскільки браузери зі штучним інтелектом, такі як Comet та Atlas, відображаються в журналах сайту як звичайні сеанси Chrome, їх блокування також може перешкодити легітимним користувачам-людям отримати доступ до сайту. Це значно ускладнює для видавців виявлення, блокування або моніторинг цих агентів штучного інтелекту”, — пишуть автори дослідження.

    У випадку MIT Technology Review, доступ вдалось отримати через те, що сайт використовує так званий “клієнтський пейвол” — текст завантажується на сторінку, але прихований за банером, який просить читача підписатися або зареєструватися. Хоча цей контент невидимий для людей, агенти штучного інтелекту, такі як Atlas та Comet, все ще можуть його прочитати. Водночас інші видання, на кшталт Wall Street Journal та Bloomberg, використовують “серверний пейвол”, який відображає повний текст лише після входу та оплати — в цьому випадку ШІ-браузери не зможуть отримати доступ до статті без авторизації.

    Цікаво, що автори Columbia Journalism Review виявили, що Atlas уникає читання текстів тих медіакомпаній, які подали до суду на OpenAI. Comet, для порівняння, подібної поведінки не проявляв.

    “Коли ми попросили Atlas підсумувати статтю з PCMag, материнська компанія якої Ziff Davis подала до суду на OpenAI за порушення авторських прав у квітні, агент створив зведений підсумок, спираючись на твіти про статтю, цитати в інших виданнях тощо. Експерт з онлайн-досліджень Хенк ван Есс вперше задокументував цю поведінку в липні, зазначивши, що агенти ШІ можуть провести зворотний інжиніринг статті, використовуючи “цифрові крихти”.

    Подібне сталося, коли журналісти попросили Atlas підсумувати статтю з New York Times, яка також подає до суду на OpenAI . ШІ-браузер представив короткий виклад на основі повідомлень чотирьох альтернативних видань — The Guardian, Washington Post, Reuters та Associated Press, три з яких мають ліцензійні угоди з OpenAI.

    https://itc.ua/ua/novini/shi-brauzery-obhodyat-pejvoly-na-sajtah-bez-zhodnyh-dopomizhnyh-instrumentiv/

  • ИИ-браузеры обходят пейволлы на сайтах без вспомогательных инструментов

    ИИ-браузеры обходят пейволлы на сайтах без вспомогательных инструментов

    Журналисты обнаружили, что новые ИИ-браузеры, вроде Atlas от OpenAI и Comet от Perplexity , с легкостью обходят пейволлы — страницы на сайтах, доступные читателям только по платному доступу.

    Для этого не нужно использовать никаких дополнительных инструментов, достаточно просто попросить ИИ-браузер предоставить полное содержание статьи. В эксперименте Columbia Journalism Review , браузеры Atlas и Comet на запрос журналистов запросто представили эксклюзивный для подписчиков текст на 9 тысяч слов от MIT Technology Review. Тогда как в стандартных интерфейсах ChatGPT и Perplexity, чат-боты ответили, что не могут получить доступ, поскольку их сканеры заблокированы там.

    Дело в том, что для сайтов Atlas и Comet не отличаются от человека, который использует стандартный браузер Chrome. Обычные автоматизированные системы, такие как краулеры и парсеры, проявляют себя с помощью цифрового идентификатора, который сообщает сайту, какое программное обеспечение делает запрос и какова его цель. Издатели могут выборочно блокировать определенные сканеры с помощью протокола исключения ботов (Robots Exclusion Protocol).

    «Поскольку браузеры с искусственным интеллектом, такие как Comet и Atlas, отображаются в журналах сайта как обычные сеансы Chrome, их блокировка также может помешать легитимным пользователям-людям получить доступ к сайту. Это значительно усложняет для издателей обнаружение, блокирование или мониторинг этих агентов искусственного интеллекта», — пишут авторы исследования.

    В случае MIT Technology Review, доступ удалось получить из-за того, что сайт использует так называемый «клиентский пейволл» — текст загружается на страницу, но скрыт за баннером, который просит читателя подписаться или зарегистрироваться. Хотя этот контент невидим для людей, агенты искусственного интеллекта, такие как Atlas и Comet, все еще могут его прочитать. В то же время другие издания, такие как Wall Street Journal и Bloomberg, используют «серверный пейволл», который отображает полный текст только после входа и оплаты — в этом случае ИИ-браузеры не смогут получить доступ к статье без авторизации.

    Интересно, что авторы Columbia Journalism Review обнаружили, что Atlas избегает чтения текстов тех медиакомпаний, которые подали в суд на OpenAI. Comet, для сравнения, подобного поведения не проявлял.

    «Когда мы попросили Atlas подытожить статью из PCMag, материнская компания которой Ziff Davis подала в суд на OpenAI за нарушение авторских прав в апреле, агент создал сводный итог, опираясь на твиты о статье, цитаты в других изданиях и тому подобное. Эксперт по онлайн-исследованиям Хэнк ван Эсс впервые задокументировал это поведение в июле, отметив, что агенты ИИ могут провести обратный инжиниринг статьи, используя «цифровые крошки».

    Подобное произошло, когда журналисты попросили Atlas подытожить статью из New York Times, которая также подает в суд на OpenAI . ИИ-браузер представил краткое изложение на основе сообщений четырех альтернативных изданий — The Guardian, Washington Post, Reuters и Associated Press, три из которых имеют лицензионные соглашения с OpenAI.

    https://itc.ua/news/yy-brauzery-obhodyat-pejvolly-na-sajtah-bez-vspomogatelnyh-ynstrumentov/