Главная › Новости › Всего 250 вредных документов способны «отравить» ИИ-модель любого размера, подсчитали в Anthropic

Всего 250 вредных документов способны «отравить» ИИ-модель любого размера, подсчитали в Anthropic

16 декабря 2025 г.

«Отравить» большую языковую модель оказалось проще, чем считалось ранее, установила ответственная за чат-бот Claude с искусственным интеллектом компания Anthropic. Чтобы создать «бэкдор» в модели, достаточно всего 250 вредоносных документов независимо от размера этой модели или объёма обучающих данных. Источник изображения: anthropic.com

Источник: https://3dnews.ru/1133995