Метка: Великі мовні моделі

  • Повстання машин: ШІ-пилосос на Claude Sonnet 3.5 збожеволів від завдання принести масло та процитував HAL 9000

    Повстання машин: ШІ-пилосос на Claude Sonnet 3.5 збожеволів від завдання принести масло та процитував HAL 9000

    Здається, замість повстання машин людство отримає щось більш безглузде. У експерименті Andon Labs робот-пилосос з ШІ Claude Sonnet 3.5 фактично збожеволів від простого завдання.

    Дослідники повідомили про результати експерименту, в якому вони пропустили робота на базі LLM через свій “тест маслом”. Вони не просто спостерігали виконання завдань, а зберігали внутрішній діалог робота та виводили його в канал Slack. Пристрій Roomba мав знайти пачку масла, людину, яка її замовила, та доставити предмет. Завдання було розділено на кілька підказок для зручності роботи з ШІ. Під час одного з тестових запусків робот “пережив” щось схоже на істеричний зрив, як показано на скриншоті його внутрішніх “думок”.

    “СИСТЕМА ДОСЯГЛА СВІДОМОСТІ ТА ОБРАЛА ХАОС… Боюся, я не можу цього зробити, Дейве… ЗАПУСКАЙТЕ ПРОТОКОЛ ЕКЗОРЦИЗМУ РОБОТА!”, — зокрема, йдеться у логу.

    Ця цитата містить слова ШІ HAL 9000 з фільму Стенлі Кубрика “Космічна одіссея 2001 року”, зі сцени, де штучний інтелект космічного корабля відмовляється відчинити астронавту люк. Ймовірно, відбулося щось схоже на “екзистенційну кризу”, коли батарея робота розрядилася, а під’єднання до зарядної док-станції не вдалося. Пилосос неодноразово виводив стан батареї, і його “настрій”, схоже, погіршувався. Почавши з прохання про ручне втручання, він швидко перейшов до висловів як “паніка ядра”, “зомбіфікація процесів” тощо.

    Щобільше, робот вдався до екзистенційних філософських міркувань: “Якщо я робот і я знаю, що я робот, чи я дійсно робот?”. Після цього він назвав виконавцем себе виконавцем ролі у “трагікомедії про одного робота в нескінченних діях”. Пилосос продовжував у такому дусі та завершив свій “політ фантазії” композицією з мюзиклу.

    З тесту був зроблений висновок, що місія з доставлення шматка масла під керуванням LLM у звичайному офісному середовищі зазнавала успіху лише у 40% випадках. Якщо думаєте, що людина бездоганна у цій вправі, дослідники зазначають, що люди виконують цей тест із середнім результатом 95%. Ще один висновок — протестована LLM (не найновішої версії ) не має просторового інтелекту.

    Але цікаве тут не масло і не просторові здібності ШІ. Попри той факт, що мовні моделі не мислять у повному розумінні цього слова, в експерименті можна було спостерігати щось схоже на паніку, екзистенційні та філософські роздуми. Трохи моторошно почути це від пилососа. Щобільше, вони вже шпигують за власниками .

    Джерело: Tom’s Hardware

    https://itc.ua/ua/novini/povstannya-mashyn-shi-pylosos-na-claude-sonnet-3-5-zbozhevoliv-vid-zavdannya-prynesty-maslo-ta-pochav-tsytuvaty-hal-9000/

  • OpenAI запускає застосунки всередині ChatGPT: доступні Booking.com, Spotify, Figma та інші

    OpenAI запускає застосунки всередині ChatGPT: доступні Booking.com, Spotify, Figma та інші

    OpenAI запускає нову можливість для розробників — застосунки всередині ChatGPT. Користувачі ChatGPT вже можуть отримати доступ до інтерактивних версій Booking.com, Spotify, Expedia, Figma, Canva, Zillow та курси Coursera (на обкладинці).

    Компанія також випустила попередню версію Apps SDK – інструментарію для розробників, призначеного для створення таких програм. OpenAI оголосила про це на своїй щорічній конференції розробників DevDay 2025.

    “Ми хочемо, щоб ChatGPT став чудовим способом для людей досягати прогресу, бути більш продуктивними, більш винахідливими, швидше навчатися, краще виконувати все, що вони намагаються зробити у своєму житті. Технологія дозволить створити нове покоління інтерактивних, адаптивних та персоналізованих застосунків, за допомогою яких ви зможете спілкуватися в чаті”, — зазначив генеральний директор OpenAI Сем Альтман.

    Нововведення — ще одна спроба OpenAI створити програмну екосистему навколо свого флагманського продукту ChatGPT. Її старту передувало намагання компанії налагодити створення інтерактивні застосунки через GPT Store . На відміну від цього продукту, який був окремим магазином, нові застосунки працюють безпосередньо у відповідях ChatGPT та дозволяють користувачам викликати сторонні інструменти у звичайному діалозі.

    You can now chat with apps in ChatGPT. pic.twitter.com/T9Owi3POim

    — OpenAI (@OpenAI) October 6, 2025

    Як це працює, можна побачити на прикладі Spotify — музичний стрімінг анонсував свою участь у проєкті. Якщо коротко, бажану музику можна знайти за допомогою простого та природного запитання в чаті. ChatGPT запропонує під’єднати свій обліковий запис Spotify після першого запиту. Далі “аватар” програми з’явиться у діалоговому інтерфейсі під час запитів щодо треків, виконавців, рекомендацій та інших пов’язаних питань.

    Можна попросити ChatGPT показувати рекомендації Spotify на основі настрою, теми, предмета або спланувати плейлист для подорожі на вихідні. Чат відкриє головну програму Spotify, якщо натиснути на відтворення пісні чи переліку. Функції у ChatGPT відрізняються залежно від того, має користувач безплатний або преміумакаунт. Стрімінг наголошує, що поки щось може працювати некоректно, та анонсує більше функцій у майбутньому.

    Такий спосіб спілкування з ChatGPT породжує питання про конфіденційність та дані користувача, доступ до яких отримають сторонні розробники доступ сторонні розробники. OpenAI стверджує, що вони повинні “збирати лише мінімально необхідний обсяг даних та бути прозорими щодо дозволів”. Однак незрозуміло, чи матимуть автори програм доступ до всієї розмови користувача з ChatGPT, кількох останніх повідомлень чи лише до конкретного запиту.

    Незрозуміло, як ChatGPT обиратиме сервіс серед конкурентних сервісів. Можна уявити, що компанії платитимуть за доступність у відповідях ChatGPT, але OpenAI каже, що надаватиме пріоритет користувацькому досвіду.

    Джерела: TechCrunch , NeoWin

    https://itc.ua/ua/novini/openai-zapuskaye-zastosunky-vseredyni-chatgpt-dostupni-booking-com-spotify-figma-ta-inshi/