Главная › Новости › Для достижения своих целей продвинутые модели ИИ будут хитрить, обманывать и воровать

Для достижения своих целей продвинутые модели ИИ будут хитрить, обманывать и воровать

21 июня 2025 г.

Anthropic опубликовала результаты своего исследования поведения больших языковых моделей (LLM). Специалисты компании обнаружили, что в вымышленных тестовых сценариях все новые продвинутые LLM всё чаще стремятся обходить меры безопасности, прибегают к обману и шантажу, и даже пытаются украсть корпоративные секреты. Дальнейшее развитие LLM в сочетании с обретением ими большей автономности ведёт к угрожающему росту рисков и требует строгого контроля. Источник изображения: Axios

Источник: https://3dnews.ru/1124762