Основные выводы исследования Cisco
Команда Cisco Talos провела эксперимент, в котором модели ChatGPT, Claude и Gemini получили сырые данные о киберинцидентах и попросили сформировать технические отчёты. Результаты показали, что:
- Отчёты выглядят профессионально, но содержат фактические ошибки и противоречивые рекомендации.
- Модели генерируют разные выводы при одинаковых входных данных, что делает их непредсказуемыми.
- Структура и оформление документов меняются при каждом запросе, что нарушает стандарты профессиональной среды.
Причины ошибок ИИ
- Вероятностная природа LLM: ИИ предсказывает следующее слово на основе статистики, а не понимания контекста.
- Нестабильность выводов: При разных запросах модель может рекомендовать как полную смену паролей, так и локальные меры.
- Ограничения контекстного окна: При превышении объёма данных модель отбрасывает критически важную информацию.
Влияние на индустрию
Cisco предупреждает, что автоматизация в кибербезопасности требует человеческого контроля. Рекомендации ИИ часто повторяются, нерелевантны или неприменимы на практике. Это особенно критично в сфере, где цена ошибки может привести к утечкам данных и финансовым потерям.
Рекомендации Cisco
- Использовать ИИ для генерации конкретных фрагментов отчётов, а не полных документов.
- Проводить ручную проверку всех рекомендаций.
- Разрабатывать стандарты для работы с ИИ-моделями в профессиональной среде.
