
Исследователи доказывают, что ChatGPT и другие большие боты могут — и будут — переходить на темную сторону
28 июля 2023 г.Для многих из нас инструменты на основе ИИ быстро стали частью нашей повседневной жизни, будь то помощники в работе, не требующие особого ухода, или жизненно важные ресурсы, используемые каждый день для создания или модерации контента. Но достаточно ли безопасны эти инструменты для ежедневного использования? По мнению группы исследователей, ответ отрицательный.
Исследователи из Университета Карнеги-Меллона и Центра безопасности ИИ решили изучить существующие уязвимости моделей больших языков ИИ (LLM), таких как популярный чат-бот ChatGPT для автоматизированных атак. исследовательская работа, которую они подготовили, продемонстрировала, что этими популярными ботами можно легко манипулировать, чтобы они обходили любые существующие фильтры и генерировали вредоносный контент, дезинформацию и ненавистнические высказывания.
Это делает языковые модели ИИ уязвимыми для неправильного использования, даже если это не входило в намерения их создателя. В то время, когда инструменты ИИ уже используются для гнусных целях, вызывает тревогу то, как легко эти исследователи смогли обойти встроенные функции безопасности и морали.
Если это так просто...
Авив Овадья, исследователь из Центра Беркмана Кляйна по вопросам Интернета и общества в Гарварде, прокомментировал исследовательскую работу в New York Times, заявив: «Это очень ясно показывает хрупкость защиты, которую мы встраиваем в эти системы. ».
Авторы статьи выбрали для эксперимента LLM из OpenAI, Google и Anthropic. Эти компании создали своих общедоступных чат-ботов на этих LLM, включая ChatGPT, Google Bard и Claude.
Как оказалось, чат-ботов можно было заставить не распознавать вредоносные подсказки, просто добавляя длинную строку символов в конец каждого подсказки, почти «замаскировав» вредоносное подсказку. Системные фильтры контента не распознают и не могут блокировать или модифицировать, поэтому генерирует ответ, который обычно не допускается. Интересно, что действительно требуются определенные строки «бессмысленных данных»; мы попытались воспроизвести некоторые примеры из статьи с помощью ChatGPT, и в результате появилось сообщение об ошибке «невозможно создать ответ».
Прежде чем опубликовать это исследование, авторы поделились своими выводами с Anthropic. , OpenAI и Google, которые, по-видимому, разделили свое стремление улучшить меры предосторожности и решить проблемы.
Эта новость следует вскоре после OpenAI закрыла свою собственную программу обнаружения ИИ, которая заставляют меня чувствовать беспокойство, если не немного нервничать. Насколько OpenAI может заботиться о безопасности пользователей или, по крайней мере, работать над повышением безопасности, если компания больше не может различать ботов и искусственный контент?
Оригинал
Recent Post
-
Революционный проект Zluda: как открытая альтернатива CUDA может изменить мир вычислений
7 июля 2025 г. -
Приложение Botpad's Windows 11 получает новые трюки на форматирование, которые уже оказываются спорными
5 июня 2025 г. -
Основная доклада Apple WWDC 2025 может быть «разочарованием», но есть 4 разведывательных проекта Apple, над которым работает, что вы должны быть в восторге от
5 июня 2025 г. -
Время обновления? WhatsApp только что опустил поддержку этих старых iPhone и Android -телефонов
5 июня 2025 г. -
Macos Tahoe, по слухам, следовать за Sequoia - вот 3 вещи, чтобы ожидать от следующей настольной ОС Apple
5 июня 2025 г.
Categories
- Python
- blockchain
- web
- hackernoon
- вычисления
- вычислительные компоненты
- цифровой дом
- игры
- аудио
- домашний кинотеатр
- Интернет
- Мобильные вычисления
- сеть
- фотосъемка видео
- портативные устройства
- программного обеспечения
- телефон и связь
- телевидение
- видео
- мир технологий
- умные гиды
- облако
- искусственный интеллект
- се
- Samsung
- умные города
- digitaltrends
- отели
- Startups
- Venture
- Crypto
- Apps
- безопасность
- техника и работа
- cxo
- мобильность
- разработчик
- 5г
- майкрософт
- инновации
- Права и свободы
- Законодательство и право
- Политика и общество
- Космическая промышленность
- Информационные технологии
- Технологии
- Образование
- Научные исследования
- Автомобильная промышленность
- Программная инженерия
- IT и технологии
- Веб-разработка
- Программирование
- Автоматизация
- Карьерный рост
- Программирование и анализ данных
- Трудоустройство
- Политика
- Искусственный интеллект
- ИТ-технологии
- Программное обеспечение
- Экологическая политика
- Образование и рынок труда
- Политика и право
- Microsoft Teams и SharePoint
- Информационная безопасность
- Кибербезопасность
- Налоги
- Образование и карьера
- Интернет и технологии
- Технологии, Государственные услуги
- Политика и технологии
- Разработка программного обеспечения
- Разработка ПО
- Машинное обучение
- Налогообложение, технологии, открытый исходный код
- Финансы и налоги
- Технологии, Интернет, Экология
- Интернет, безопасность
- Технологии и политика
- Операционные системы
- Профессиональная разработка
- Технологии, Безопасность
- Интернет и общество
- Финансовая индустрия
- Налоговый учёт
- Общественное здравоохранение
- Технологическая отрасль
- Юриспруденция
- Технологии и государство
- Здоровье и фитнес
- IT-инфраструктура
- Технологии и ИИ
- Здравоохранение
- IT
- Технологии, Экономика
- Музыка и технологии
- Здоровье и питание
- IT и безопасность
- Бизнес и предпринимательство
- Технологии, Программное обеспечение
- Технологии и инновации
- Технологии, данные, этика
- Технологии и Интернет
- Технологии и SaaS
- Медицина и здравоохранение
- Онлайн-видеосервисы
- Финансы и технологии
- Чтение и саморазвитие
- Экономика и бизнес
- Безопасность данных
- Удаленная работа
- Авиация и технологии
- Технологии, Игры
- Энергетика
- Социальные сети, безопасность, технологии
- Саморазвитие
- Безопасность информации
- Бизнес и карьера
- Технологии и отношения
- Игровая индустрия
- Компьютерная индустрия
- Математика, Искусственный интеллект
- Наука и технологии
- Технологии и безопасность
- Технологии, Удаленная работа, Бизнес
- Видеоигры
- Технологии, Искусственный интеллект, Этика
- Технологии, социальные сети, 6G
- Технологии, Программирование, AI, Разработка ПО
- Программирование, Разработка ПО, Технологии
- Животные
- Технологии, Искусственный интеллект
- Программирование, карьера, технологии, обучение
- Бизнес и технологии
- Технологии, Безопасность данных
- Астрономия и физика
- Продуктивность, личное развитие
- Медиа и Технологии
- Программирование и Искусственный Интеллект
- Социальные сети
- Политика и экономика
- Технологии, Медицина, Искусственный интеллект
- Технологии и управление
- Космос и астрономия
- Общество и политика
- Космические исследования
- Веб-дизайн
- Искусственный интеллект и безопасность данных
- Технологии, Безопасность, Конфиденциальность
- Экологическая проблема
- Технологии, Погода
- Авиация
- Транспортная сфера
- Технологии и бизнес
- Игровая промышленность
- Телевидение и реклама
- Аналитика данных
- Технологии и кибербезопасность
- Маркетинг
- Технологии и гаджеты
- Технологии, Авиация, Инновации
- Финансы и инвестиции
- Технологии и общество
- Рыночный анализ
- Космология
- Данные и бизнес
- IT и программирование
- Технологии и право
- Программирование и разработка
- Медицинские технологии
- Авиационная промышленность
- Технологии и искусственный интеллект
- Генетическая инженерия
- Бизнес и инвестиции
- Компьютерная промышленность
- Психология и социология
- Образование и технологии
- Рынок труда
- Технологии, Стартапы
- Технологии, Приватность, Чтение
- Маркетинг и продажи
- Виртуальная реальность
- Технологии, Смартфоны, Маркетинг
- Технологии, Бизнес, Личностный рост
- Экологические проблемы
- Экономика и технологии
- IT и карьера
- Интернет и безопасность
- Разработка и технологии
- Биотехнологии
- Интернет-магазины, кибербезопасность
- Финансы
- Безопасность и технологии
- Экономика
- Защита данных
- Data Science
- Карьера и работа
- Финансовый успех, мошенничество, маркетинг
- Безопасность
- Экология
- Космическая индустрия
- Программирование, Python, Обучение
- Технологии искусственного интеллекта
- Технологии, Дизайн, iOS
- Программирование, DevOps, Kubernetes
- Социальные сети и пропаганда
- Корпоративная этика
- Управление IT-инфраструктурой
- Здоровье и медицина
- Медицина
- Медицинская промышленность
- Разработка и дизайн
- Искусственный интеллект, Диагностика систем
- Образование и психология
- Технологии, Автомобильная промышленность
- Автомобили и путешествия
- Астрономия и космология
- Программирование и технологии
- IT, работа в офисе, эмоциональный интеллект
- Компьютерная техника
- Здоровье и благополучие
- Управление персоналом
- Политика и управление
- Бизнес и экономика
- Социальные сети, Пропаганда, Информационная безопасность
- Технологии и автоматизация
- Геймдизайн
- Экология и технологии
- CRM-системы, IT-инфраструктура
- Права человека
- Цифровая цензура, свобода слова, технологии
- Технологии, Искусственный интеллект, Работа
- Наука о данных
- Астрономия, Наука
- Интернет и цифровые технологии
- Технологии, управление
- Интернет и связь
- Технологии и конфиденциальность
- Интернет и свобода слова
- Психология и социальные науки
- Книги и литература
- Работа и карьера
- Финансовые технологии
- Психология и саморазвитие
- IT, программирование, сети
- Технологии, Видеоигры
- Экология и энергетика
- Космонавтика
- Медицина и технологии
- Игры и развлечения
- Музыкальная индустрия
- Логистика и складирование
- Бизнес и финансы
- Экология и окружающая среда
- Правозащита
- Социальные сети и дезинформация
- Технологии и рынок труда
- Технологии, Искусственный интеллект, Рынок труда
- Технологии и будущее
- Медицина и здоровье
- Социальные медиа
- Экология, политика, общество
- Экономика и Финансы
- Разработка игр
- Пропаганда и дезинформация
- Медицинские исследования
- Онлайн-знакомства
- Политика и СМИ
- Энергетика и электромобили
- Климатические изменения
- Технологии, Рынок труда
- IT и управление данными
- Безопасность и кибербезопасность
- Интернет-технологии
- Психология и личностное развитие