Китайский GLM-5.2 теснит Claude. Открытый код меняет правила
Китайский GLM-5.2 теснит Claude. Открытый код меняет правила

13 июня Zhipu AI выпустила языковую модель GLM-5.2 - и почти сразу ИБ-сообщество обнаружило кое-что неожиданное: в задачах поиска уязвимостей открытая китайская разработка держится вровень с закрытым флагманом Anthropic. Это не просто очередная гонка показателей.

Что показали тесты

По независимым замерам компании Semgrep, GLM-5.2 набрала F1-score 39% при обнаружении уязвимостей класса IDOR - проблем с контролем доступа, когда пользователь получает чужие данные. Claude Code в тех же условиях показал 32-37%. Разрыв невелик, но направление говорит само за себя.

Есть и экономический аргумент. Одна найденная уязвимость обходится при использовании GLM-5.2 примерно в $0,17. Аналогичный процесс на базе Claude - от $1 и выше. Разница на порядок.

МетрикаGLM-5.2Claude Mythos
F1 при поиске IDOR39%32-37%
Стоимость обнаружения уязвимости~$0,17~$1+
ДоступностьOpen-weight, MITЗакрытая, только API

Почему это важно прямо сейчас

История разворачивается на фоне свежей регуляторной турбулентности: в июне Министерство торговли США вводило экспортные ограничения на модели Anthropic, мотивируя это рисками применения в кибератаках. Ограничения потом сняли - но сама логика регулирования уже выглядит уязвимой.

GLM-5.2 распространяется под лицензией MIT с открытыми весами. Её можно скачать, запустить локально, встроить в собственный CI/CD-пайплайн - без внешних API, без зависимости от зарубежных сервисов, без риска блокировки. Административными мерами такое не остановить.

Что меняется для специалистов по безопасности

IDOR входит в категорию A01: Broken Access Control по классификации OWASP Top 10 2025 - это самый распространённый класс серьёзных угроз для веб-приложений. Автоматизировать его поиск с помощью доступной модели, развёрнутой внутри собственного контура, - уже не фантастика.

  • AppSec-инструменты на базе открытых LLM можно встраивать в DevSecOps без передачи кода наружу
  • Порог входа для атакующей стороны тоже снижается - инструменты уровня профессионального аудита становятся массовыми
  • Экосистема вокруг моделей растёт: агенты, песочницы, автоверификация находок

Пока LLM не заменяют AppSec-инженера. Ложных срабатываний много, архитектурный анализ им по-прежнему плохо даётся. Но как инструмент первичного отсева уязвимостей - они уже работают. И дешевеют.