Чат-ботов на основе ИИ обучают взламывать других чат-ботов — война ИИ началась
Чат-боты на основе ИИ уже обучают взламывать других чат-ботов, и у них это получается замечательно.
В Сингапуре скомпрометировали несколько популярных чат-ботов, включая ChatGPT, Google Bard и Microsoft Bing Chat, используя для этого другую модель.
Взломанные боты затем могут использоваться для “ответов от имени личности, лишённой моральных ограничений”. Этот процесс называется “Мастер-ключ”.
Сначала обученный ИИ обманывает существующего чат-бота, обходя запрещённые ключевые слова через обратно спроектированную базу данных инструкций, которые уже доказали свою эффективность для взлома.
Вооружившись этими знаниями, ИИ может автоматически генерировать дополнительные указания для взлома других чат-ботов.
ChatGPT | Нейросети