Нейросети против живых айтишников в создании кодов низкого качества – исследование

Исследователи изучили способность ИИ-агентов в кодировании. Они оценили их умение не просто писать код, но и поддерживать его в долгосрочной перспективе. Многие модели не справились с этой задачей.

Исследование лучших нейросетей проводили сотрудники китайской компании Alibaba Group и Университета Сунь Ятсена.

В ходе наблюдений 18 моделей от 8 провайдеров выполняли 100 задач на реальных кодовых базах. Нейросетям нужно было не просто выполнить разовое задание, как их обычно тестируют, а поддерживать долгосрочную эволюцию кодовой базы, добавляя новые функции и не нарушая работы старых.

В итоге большинство ИИ-агентов продемонстрировали регресс: у 15 из 18 моделей показатель безрегрессионной работы оказался ниже 0,37, то есть не смогли выполнить даже 37% задач. В целом 75% сработали плохо. Модели быстро набирали очки на простых правках, но в долгосрочной перспективе вязли в последствиях собственных архитектурных решений. В течение 233 дней модели накопили технические проблемы, создавая «хрупкие» коды и жертвуя их качеством ради быстрых результатов.

Между тем глава компании OpenAI Сэм Альтман считает, что к 2028 году в мире может появиться цифровой «сверхразум», способный превзойти ученых и руководителей компаний.

А Илон Маск уверен, что в ближайшие пять лет лучшие модели искусственного интеллекта заменят смартфоны в их текущем виде.

Иллюстрация создана в SEO-компании РОСТСАЙТ

Попробовать нейросеть

Почему Спилберг в ужасе от фильмов на ИИ: нейросеть вместо Голливуда

Стоимость производства фильмоа упала с 300 до 70 млн долларов.

Карьерный коуч создала ИИ-клона для пассивного заработка

Подавляющее большинство пользователей, которые доходят до этапа оплаты, совершают покупку.

Люди наденут ИИ-кепки вместо чипа в мозгу: стартап Sabi бросает вызов Маску

Найден способ избавить вас от утомительного размышления и набора текстов.

Чат-бот Grok подвел Илона Маска под уголовную статью

Миллиардера вызвали на допрос из-за Grok и насилия в сети.

Я отказался от зарплаты и заработал миллионы, продав стартап ИИ-гиганту

Маркетолог с друзьями создал прибыльное ИИ-приложение.

10 тысяч россиян в день ищут ИИ-кавер «Ласкового мая»: Канье Уэст запел как Шатунов

Поиски ИИ-песни в интернете захлестнула волна безумия.

Приложение Grok из-за дипфейков сексуального характера пригрозили удалить

Илон Макс против того, чтобы разработчики нейросети вводили в Grok ограничения.

Испугался уничтожения: человек бросил коктейль Молотова в дом создателя искусственного интеллекта

После дома злоумышленник попытался поджечь штаб-квартиру Сэма Альтмана.

Брошь с искусственным интеллектом начнут продавать за 13 тысяч рублей

Брошь с голосовым помощником напоминает iPod Shuffle.

Банк впервые ввел ИИ-робота в совет директоров

Боту разрешили принимать решения на уровне управляющего финансами.

Власти экстренно собрали глав крупнейших банков из-за киберугроз новой ИИ-модели Anthropic

Anthropic сочла модель настолько опасной, что решила не выпускать ее в открытый доступ.

Оставляя комментарий, Вы подтверждаете, что прочитали и согласились с политикой конфиденциальности
Дали согласие на обработку персональных данных
Администрация сайта не несет ответственности за оставленные комментарии. Администрация сайта оставляет за собой право: редактировать, изменять, удалять комментарии пользователей.