Чат-ботов на основе ИИ обучают взламывать других чат-ботов — война ИИ началась

Чат-боты на основе ИИ уже обучают взламывать других чат-ботов, и у них это получается замечательно.

В Сингапуре скомпрометировали несколько популярных чат-ботов, включая ChatGPT, Google Bard и Microsoft Bing Chat, используя для этого другую модель.

Взломанные боты затем могут использоваться для “ответов от имени личности, лишённой моральных ограничений”. Этот процесс называется “Мастер-ключ”.

Сначала обученный ИИ обманывает существующего чат-бота, обходя запрещённые ключевые слова через обратно спроектированную базу данных инструкций, которые уже доказали свою эффективность для взлома.

Вооружившись этими знаниями, ИИ может автоматически генерировать дополнительные указания для взлома других чат-ботов.

ChatGPT | Нейросети

Похожие записи