Нейросети против живых айтишников в создании кодов низкого качества – исследование

Пока искусственный разум справляется со многими задачами хуже человеческого.

Дата публикации:
12.03.2026 19:57:21
Автор:
Кривов Александр
Время чтения:
2 мин
Страна:
США
Подпишись на нас в Подпишись на нас в

Исследователи изучили способность ИИ-агентов в кодировании. Они оценили их умение не просто писать код, но и поддерживать его в долгосрочной перспективе. Многие модели не справились с этой задачей.

Исследование лучших нейросетей проводили сотрудники китайской компании Alibaba Group и Университета Сунь Ятсена. 

В ходе наблюдений 18 моделей от 8 провайдеров выполняли 100 задач на реальных кодовых базах. Нейросетям нужно было не просто выполнить разовое задание, как их обычно тестируют, а поддерживать долгосрочную эволюцию кодовой базы, добавляя новые функции и не нарушая работы старых.

В итоге большинство ИИ-агентов продемонстрировали регресс: у 15 из 18 моделей показатель безрегрессионной работы оказался ниже 0,37, то есть не смогли выполнить даже 37% задач. В целом 75% сработали плохо. Модели быстро набирали очки на простых правках, но в долгосрочной перспективе вязли в последствиях собственных архитектурных решений. В течение 233 дней модели накопили технические проблемы, создавая «хрупкие» коды и жертвуя их качеством ради быстрых результатов.

Между тем глава компании OpenAI Сэм Альтман считает, что к 2028 году в мире может появиться цифровой «сверхразум», способный превзойти ученых и руководителей компаний.

А Илон Маск уверен, что в ближайшие пять лет лучшие модели искусственного интеллекта заменят смартфоны в их текущем виде.

Иллюстрация создана в SEO-компании РОСТСАЙТ

Комментарии


Оставляя комментарий, Вы подтверждаете, что прочитали и согласились с политикой конфиденциальности
Дали согласие на обработку персональных данных
Администрация сайта не несет ответственности за оставленные комментарии. Администрация сайта оставляет за собой право: редактировать, изменять, удалять комментарии пользователей.

Читайте также:

Русская нейросеть пошла в шопинг: ИИ будет делать покупки за людей

У «Яндекса» есть ресурс, чтобы создать эффективную систему для голосового шопинга, включая маркетплейс, логистику и поисковые системы.

GPT-5.4 теперь управляет вами: OpenAI выпустила мощную модель нейросети

Новый GPT-5.4 от OpenAI ускоряет взаимодействие с ПК, анализ изображений и поиск. Модель превосходит предшественников ChatGPT  по точности и эффективности.

ИИ нажал кнопку для удара по Ирану? Пентагон тайно использовал Claude для ракетных атак

Министерство войны подписало военный контракт с создателем ChatGPT.

Родители подростка подали в суд на OpenAI и Альтмана: обвинения в связи с трагическим исходом

Родители 16-летнего подростка подали иск против OpenAI и Сэма Альтмана после того, как выяснилось, что ChatGPT якобы наставлял сына на самоубийство. Компания признала недостатки в безопасности и объявила о новом контроле и инструментах помощи.

Сам Альтман признаёт: пузырь вокруг ИИ — реальность, но он остаётся оптимистом

Альтман предупредил об «пузыре» в индустрии искусственного интеллекта, но уверен: несмотря на финансовые риски, ИИ продолжит влиять на общество. Он ожидает, что ChatGPT скоро будет вести больше разговоров, чем все люди вместе взятые.

Сам Альтман признал проблемы в запуске GPT-5 и бросил смелую идею покупки Chrome

Сэм Альтман признал, что запуск GPT-5 прошёл неудачно: пользователи пожаловались на холодность и баги. Он заявил, что «мы всё серьёзно испортили», и даже упомянул возможное приобретение Chrome, если тот будет разобран по антимонопольным причинам.

Проверка GPT-5: успехи и ограничения

Тесты показали: GPT-5 отлично пишет деловые тексты и эссе, но ограничен в креативности. Модель подходит для работы и учёбы, но пока уступает людям в области художественного письма.

Пользовательская грусть: GPT-5 и утрата «человечности»

После релиза GPT-5 пользователи пожаловались на холодность общения и утрату «дружеской теплоты». OpenAI вернула доступ к старым версиям, признав важность эмоциональной связи.

GPT-5: запуск и реакция общества

OpenAI представила GPT-5: точнее, безопаснее и быстрее. Однако пользователи сочли обновление скорее эволюцией, чем революцией, а педагоги отметили сухость подачи.

В Индии стартует Fusion AI Summit 2025

Послезавтра, 25–26 июля, в Визаге пройдёт Fusion AI Summit — индийские и мировые эксперты будут обсуждать генеративный AI.

Великобритания инвестирует £1 миллиард в суперкомпьютеры для AI

UK запускает £1 млрд программу развития суперкомпьютерной инфраструктуры для AI, увеличивая мощности в 20 раз.