Devin: ШІ-програміст, який не впорався з поставленими завданнями

Дослідники з Answer.AI провели тестування нейромережі Devin, яка була презентована як інноваційний інструмент для автоматизації програмування. Однак результати виявилися невтішними — із 20 завдань Devin зміг успішно виконати лише три.

Що обіцяли розробники?

Компанія Cognition, яка представила Devin у березні 2024 року, заявляла, що цей ШІ здатен:

самостійно створювати, запускати та вдосконалювати веб-додатки;

адаптуватися до нових технологій і вивчати їх за документацією;

виявляти та виправляти помилки у коді;

працювати на фриланс-біржах, виконуючи різноманітні завдання.

Реальні результати

Devin впорався лише із трьома завданнями:

1. Переніс дані з бази Notion до Google Таблиць.

2. Створив трекер для аналізу положення Юпітера і Сатурна.

3. Провів дослідження для створення бота в Discord на Python.

Однак більшість завдань були провалені. Наприклад, Devin не зміг розгорнути додаток на платформі Railway, оскільки ця платформа не підтримувала заданий тип програм. Нейромережа витратила понад добу на марні спроби.

Проблеми ШІ

Головною проблемою стала неспроможність Devin розпізнавати нерозв’язні завдання. Інструмент витрачав багато часу на пошук рішень там, де їх не могло бути. Крім того, нейромережа часто обирала занадто складні підходи до простих задач.

Чи є майбутнє у Devin?

Дослідники відзначили, що передбачити успішність роботи цього ШІ неможливо. Навіть у разі виконання завдання Devin часто витрачав на це значно більше часу, ніж очікувалося.

Більше новин про технології читайте на нашому каналі: Tech Today UA.

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!
TechToday UA
TechToday UA@TechToday_UA

TechToday UA🇺🇦

8.3KПрочитань
5Автори
1Читачі
Підтримати
На Друкарні з 29 травня

Більше від автора

  • 💥 Масштабний витік: викрадено дані 190 мільйонів американців

    У жовтні минулого року UnitedHealth повідомила Управлінню з громадянських прав Міністерства охорони здоров'я та соціальних служб США, що атака торкнулася 100 мільйонів осіб. Однак тепер компанія уточнила, що постраждало 190 мільйонів клієнтів.

    Теми цього довгочиту:

    Кібербезпека
  • DeepSeek: китайський ШІ, який обігнав ChatGPT у США

    Китайський стартап DeepSeek стрімко набирає популярність після того, як його ШІ-асистент очолив рейтинг безкоштовних застосунків в американському App Store, випередивши ChatGPT. Це викликало дискусії щодо ефективності експортних обмежень США на передові AI-чіпи для Китаю.

    Теми цього довгочиту:

    Deepseek

Вам також сподобається

Коментарі (0)

Підтримайте автора першим.
Напишіть коментар!

Вам також сподобається