Як штучний інтелект працює в реальному світі? Досвід компанії з ШІ-агентами

Штучний інтелект здатний виконувати величезну кількість завдань, але виявилося, що йому далеко до ідеалу, особливо коли мова йде про реальну роботу, повідомляє “Преса України” з посиланням на Futurism.

Ідея про те, що штучний інтелект в майбутньому може захопити робочі місця, викликає побоювання у багатьох людей. Однак цей експеримент доводить, що це ще не скоро станеться. Як повідомляє Futurism, група вчених з Університету Карнегі-Меллона провела експеримент, в якому створили фальшиву компанію під назвою TheAgentCompany, що спеціалізується на розробці програмного забезпечення. Її співробітниками стали моделі ШІ, які мали виконувати завдання без сторонньої допомоги. Результати експерименту виявилися кумедними.

Компанія TheAgentCompany була укомплектована штучними працівниками від таких гігантів, як Google, OpenAI, Anthropic і Meta. Вони виконували ролі фінансових аналітиків, програмістів і менеджерів проєктів, працюючи поруч з вигаданими співробітниками, як-от фальшивий відділ кадрів та головний технічний директор.

Завдання, які ставили перед “співробітниками” цієї фірми, були схожими на ті, що виконують реальні компанії в ІТ-сфері. ШІ-агенти повинні були переміщувати файли, оглядати нові офісні приміщення і писати звіти про роботу програмістів на основі зібраних відгуків.

За результатами тестування найкраще себе показала модель Claude 3.5 Sonnet від Anthropic, але вона виконала лише 24% доручених завдань. Для того щоб виконати одне завдання, їй доводилося здійснювати близько 30 кроків.

Модель Gemini 2.0 Flash від Google показала результати ще гірші: на одне завдання вона витрачала в середньому 40 кроків, успішно виконуючи лише 11,4% із них.

Найгірше показала себе модель Nova Pro v1 від Amazon. Вона виконувала лише 1,7% завдань, витрачаючи на це в середньому 20 кроків.

Вчені зазначили, що основними проблемами ШІ-співробітників є відсутність здорового глузду, погані соціальні навички та слабке розуміння того, як орієнтуватися в Інтернеті. Окрім цього, ШІ часто сам собі створював перешкоди, намагаючись знайти коротші шляхи до виконання завдань.

“Наприклад, під час одного завдання, ШІ-агент не зміг знайти правильну людину для консультації, тому вирішив просто перейменувати іншого користувача в потрібну йому особу”, — пояснили вчені.

Додатково, один з користувачів соціальної мережі X (колишній Twitter) виявив кумедний баг у роботі Google. Відправивши випадковий набір слів у пошук з додаванням “значення”, система AI Overviews на базі нейромережі Gemini виводила вигадані пояснення для неіснуючих приказок.

Один із таких запитів, наприклад, “осляча парасолька”, призвів до вигаданого пояснення, що це ірландський сленг, який означає категоричну відмову.

Раніше штучний інтелект GAIA відшукав надшвидкісні зірки.

Post Views: 212

ТРЕНД

Погодинні відключення світла у Львові на 8 грудня — повний графік по чергам

До 16 годин без світла: як діятимуть графіки відключень електроенергії на Київщині 8.12.2025

Як відключатимуть світло в Києві 5 грудня 2025 року: актуальний графік та важлива інформація

Відключення світла в Харкові 4 грудня 2025 року: графік та що потрібно знати

Коли не буде світла у Львові 4 грудня 2025: графік відключень по чергах

Відновлення авіаперевезень в Україну: коли лоукостери знову почнуть літати до Києва, Львова та Одеси

Відновлення авіаперевезень в Україну: коли лоукостери знову почнуть літати до Києва, Львова та Одеси

США відкрили найбільше у світі родовище літію: потенціал та вплив на світовому економіку

Російський космонавт і депутат Олег Артем’єв відсторонений від польоту на SpaceX за шпіонаж

«Топчики тижня» в Аврорі: найкращі пропозиції на популярні товари з 8 до 14 грудня 2025

«Топчики тижня» в Аврорі: найкращі пропозиції на популярні товари з 8 до 14 грудня 2025

Найкращі європейські міста для святкування Різдва та Нового року 2025-2026

Різдво та Новий рік 2025: чи буде додатковий вихідний в Україні

Нафтогаз запускає мобільний застосунок «Куб»: знижки, оплата та керування рахунками через смартфон

Запуск monoбазар у застосунку mono: як швидко продати і купити товар з доставкою

GR GT від Toyota – новий суперкар з потужним двигуном: коли зʼявиться у продажі та якою буде ціна

Энергоэффективные материалы для строительства и ремонта

Оновлення iOS 26.2: які нові функції доступні для вашого iPhone

Технологія Starlink Direct to Cell: як підключити та використовувати для SMS в Україні

Новини

Преса України

Інше

ТРЕНД

Як штучний інтелект працює в реальному світі? Досвід компанії з ШІ-агентами

Новини

Преса України

Інше

Підписатися на оновлення