У 10 000 разів менша модель ШІ TRM випередила великі мовні моделі в логіці

Невелика модель ШІ, яка навчається на обмеженому наборі даних (TRM) перевершила деякі з LLM у тесті “Корпус абстрактного мислення для штучного інтелекту загального призначення”.  Цей тест включає візуальні логічні головоломки, покликані збити з пантелику більшість моделей ШІ. TRM-модель доволі складно порівняти з LLM, оскільки вона вузькоспеціалізована, перевершуючи інших лише у розв’язані логічних головоломок, як судоку…

Читать далее

Повстання машин: ШІ-пилосос на Claude Sonnet 3.5 збожеволів від завдання принести масло та процитував HAL 9000

Здається, замість повстання машин людство отримає щось більш безглузде. У експерименті Andon Labs робот-пилосос з ШІ Claude Sonnet 3.5 фактично збожеволів від простого завдання. Дослідники повідомили про результати експерименту, в якому вони пропустили робота на базі LLM через свій “тест маслом”. Вони не просто спостерігали виконання завдань, а зберігали внутрішній діалог робота та виводили його…

Читать далее

OpenAI запускає застосунки всередині ChatGPT: доступні Booking.com, Spotify, Figma та інші

OpenAI запускає нову можливість для розробників — застосунки всередині ChatGPT. Користувачі ChatGPT вже можуть отримати доступ до інтерактивних версій Booking.com, Spotify, Expedia, Figma, Canva, Zillow та курси Coursera (на обкладинці). Компанія також випустила попередню версію Apps SDK – інструментарію для розробників, призначеного для створення таких програм. OpenAI оголосила про це на своїй щорічній конференції розробників…

Читать далее