Китайский GLM-5.2 теснит Claude. Открытый код меняет правила

13 июня Zhipu AI выпустила языковую модель GLM-5.2 - и почти сразу ИБ-сообщество обнаружило кое-что неожиданное: в задачах поиска уязвимостей открытая китайская разработка держится вровень с закрытым флагманом Anthropic. Это не просто очередная гонка показателей.

Что показали тесты

По независимым замерам компании Semgrep, GLM-5.2 набрала F1-score 39% при обнаружении уязвимостей класса IDOR - проблем с контролем доступа, когда пользователь получает чужие данные. Claude Code в тех же условиях показал 32-37%. Разрыв невелик, но направление говорит само за себя.

Есть и экономический аргумент. Одна найденная уязвимость обходится при использовании GLM-5.2 примерно в $0,17. Аналогичный процесс на базе Claude - от $1 и выше. Разница на порядок.

Метрика	GLM-5.2	Claude Mythos
F1 при поиске IDOR	39%	32-37%
Стоимость обнаружения уязвимости	~$0,17	~$1+
Доступность	Open-weight, MIT	Закрытая, только API

Почему это важно прямо сейчас

История разворачивается на фоне свежей регуляторной турбулентности: в июне Министерство торговли США вводило экспортные ограничения на модели Anthropic, мотивируя это рисками применения в кибератаках. Ограничения потом сняли - но сама логика регулирования уже выглядит уязвимой.

GLM-5.2 распространяется под лицензией MIT с открытыми весами. Её можно скачать, запустить локально, встроить в собственный CI/CD-пайплайн - без внешних API, без зависимости от зарубежных сервисов, без риска блокировки. Административными мерами такое не остановить.

Что меняется для специалистов по безопасности

IDOR входит в категорию A01: Broken Access Control по классификации OWASP Top 10 2025 - это самый распространённый класс серьёзных угроз для веб-приложений. Автоматизировать его поиск с помощью доступной модели, развёрнутой внутри собственного контура, - уже не фантастика.

AppSec-инструменты на базе открытых LLM можно встраивать в DevSecOps без передачи кода наружу
Порог входа для атакующей стороны тоже снижается - инструменты уровня профессионального аудита становятся массовыми
Экосистема вокруг моделей растёт: агенты, песочницы, автоверификация находок

Пока LLM не заменяют AppSec-инженера. Ложных срабатываний много, архитектурный анализ им по-прежнему плохо даётся. Но как инструмент первичного отсева уязвимостей - они уже работают. И дешевеют.

Что показали тесты

Почему это важно прямо сейчас

Что меняется для специалистов по безопасности

Другие статьи

Мерт Рамазан Демир и современный мир турецких актеров-мужчин: кто они и почему их популярность растёт?

Лучшие фото Мэрилин Монро: Взгляд на икону стиля и красоты

Сиссоко: История, Влияние и Современное Значение