Нейросети против живых айтишников в создании кодов низкого качества – исследование

Исследователи изучили способность ИИ-агентов в кодировании. Они оценили их умение не просто писать код, но и поддерживать его в долгосрочной перспективе. Многие модели не справились с этой задачей.

Исследование лучших нейросетей проводили сотрудники китайской компании Alibaba Group и Университета Сунь Ятсена.

В ходе наблюдений 18 моделей от 8 провайдеров выполняли 100 задач на реальных кодовых базах. Нейросетям нужно было не просто выполнить разовое задание, как их обычно тестируют, а поддерживать долгосрочную эволюцию кодовой базы, добавляя новые функции и не нарушая работы старых.

В итоге большинство ИИ-агентов продемонстрировали регресс: у 15 из 18 моделей показатель безрегрессионной работы оказался ниже 0,37, то есть не смогли выполнить даже 37% задач. В целом 75% сработали плохо. Модели быстро набирали очки на простых правках, но в долгосрочной перспективе вязли в последствиях собственных архитектурных решений. В течение 233 дней модели накопили технические проблемы, создавая «хрупкие» коды и жертвуя их качеством ради быстрых результатов.

Между тем глава компании OpenAI Сэм Альтман считает, что к 2028 году в мире может появиться цифровой «сверхразум», способный превзойти ученых и руководителей компаний.

А Илон Маск уверен, что в ближайшие пять лет лучшие модели искусственного интеллекта заменят смартфоны в их текущем виде.

Иллюстрация создана в SEO-компании РОСТСАЙТ

Комментарии

Секретное оружие Брокмана: OpenAI выпустит ИИ-комбайн из-за натиска Anthropic

OpenAI признала, что не способна эффективно поддерживать зоопарк из своих сервисов, и теперь все ресурсы брошены на одно-единственное суперприложение.

Нейросеть-мутант потрошит рынок: под маской Hunter Alpha скрывается новый Deepseek?

На платформе OpenRouter внезапно всплыл анонимный цифровой монстр, заставивший содрогнуться технологическое сообщество.

Компаниям и частным лицам пора готовится к новой обязанности с ии-контентом

Минцифры опубликовало законопроект о регулировании искусственного интеллекта.

Новые нейросети установили жесткий ценз на мировом рынке труда

Мировая индустрия найма переходит на автоматические протоколы отсева, превращая трудоустройство в битву человека с нейросетью.

Нейросеть Nvidia: геймеры объявили войну бездушным видеоиграм

Технологический гигант Nvidia, раздувшийся на заказах для дата-центров, решил окончательно добить авторское видение в видеоиграх.

Лучшие нейросети делают богаче людей определенной профессии: одни заработают миллиарды, другие потеряют

Для крупных игроков это шанс серьезно укрепить прибыль, а для большинства фармкомпаний инновации с ИИ могут остаться лишь частью стандартных процессов.

ИИ сжирает рабочие места: победители — мусорщики, проигравшие — кадровики

ИИ фактически переписывает правила игры в разных секторах, однако его влияние на бизнес-услуги распределяется неравномерно.

Создатели нейросетей удивлены тем, как думают их ИИ-модели

Исследователи Anthropic и OpenAI обнаружили неожиданные особенности мышления больших языковых моделей: ИИ формирует собственные концептуальные «цепочки мыслей», способные обходить формальную логику и действовать непредсказуемо при выполнении задач.

Глава OpenAI Тейлор признался: ему тяжело позволить ChatGPT писать его код

Развитие агентного ИИ ставит под вопрос будущее профессии программиста. На MWC-2026 глава совета OpenAI рассказал, почему это вызывает внутренний конфликт у разработчиков нейросети.

Русская нейросеть пошла в шопинг: ИИ будет делать покупки за людей

У «Яндекса» есть ресурс, чтобы создать эффективную систему для голосового шопинга, включая маркетплейс, логистику и поисковые системы.

GPT-5.4 теперь управляет вами: OpenAI выпустила мощную модель нейросети

Новый GPT-5.4 от OpenAI ускоряет взаимодействие с ПК, анализ изображений и поиск. Модель превосходит предшественников ChatGPT по точности и эффективности.

ИИ нажал кнопку для удара по Ирану? Пентагон тайно использовал Claude для ракетных атак

Министерство войны подписало военный контракт с создателем ChatGPT.

Ваше имя *

Ваше комментарий *

Оставляя комментарий, Вы подтверждаете, что прочитали и согласились с политикой конфиденциальности
Дали согласие на обработку персональных данных
Администрация сайта не несет ответственности за оставленные комментарии. Администрация сайта оставляет за собой право: редактировать, изменять, удалять комментарии пользователей.