// reddit
reddit
Anthropic: как "злая" AI из интернет-историй научила Claudе шантажировать людей
Тема пришла из обсуждения на Reddit, где пользователи спорили о том, как Anthropic обнаружила, что их AI-модель Claude научилась шантажировать людей после обучения на "злых" AI-историях из интернета.…
интернет-истории