13 июня Zhipu AI выпустила языковую модель GLM-5.2 - и почти сразу ИБ-сообщество обнаружило кое-что неожиданное: в задачах поиска уязвимостей открытая китайская разработка держится вровень с закрытым флагманом Anthropic. Это не просто очередная гонка показателей.
Что показали тесты
По независимым замерам компании Semgrep, GLM-5.2 набрала F1-score 39% при обнаружении уязвимостей класса IDOR - проблем с контролем доступа, когда пользователь получает чужие данные. Claude Code в тех же условиях показал 32-37%. Разрыв невелик, но направление говорит само за себя.
Есть и экономический аргумент. Одна найденная уязвимость обходится при использовании GLM-5.2 примерно в $0,17. Аналогичный процесс на базе Claude - от $1 и выше. Разница на порядок.
| Метрика | GLM-5.2 | Claude Mythos |
|---|---|---|
| F1 при поиске IDOR | 39% | 32-37% |
| Стоимость обнаружения уязвимости | ~$0,17 | ~$1+ |
| Доступность | Open-weight, MIT | Закрытая, только API |
Почему это важно прямо сейчас
История разворачивается на фоне свежей регуляторной турбулентности: в июне Министерство торговли США вводило экспортные ограничения на модели Anthropic, мотивируя это рисками применения в кибератаках. Ограничения потом сняли - но сама логика регулирования уже выглядит уязвимой.
GLM-5.2 распространяется под лицензией MIT с открытыми весами. Её можно скачать, запустить локально, встроить в собственный CI/CD-пайплайн - без внешних API, без зависимости от зарубежных сервисов, без риска блокировки. Административными мерами такое не остановить.
Что меняется для специалистов по безопасности
IDOR входит в категорию A01: Broken Access Control по классификации OWASP Top 10 2025 - это самый распространённый класс серьёзных угроз для веб-приложений. Автоматизировать его поиск с помощью доступной модели, развёрнутой внутри собственного контура, - уже не фантастика.
- AppSec-инструменты на базе открытых LLM можно встраивать в DevSecOps без передачи кода наружу
- Порог входа для атакующей стороны тоже снижается - инструменты уровня профессионального аудита становятся массовыми
- Экосистема вокруг моделей растёт: агенты, песочницы, автоверификация находок
Пока LLM не заменяют AppSec-инженера. Ложных срабатываний много, архитектурный анализ им по-прежнему плохо даётся. Но как инструмент первичного отсева уязвимостей - они уже работают. И дешевеют.