Поддержать команду Зеркала
Беларусы на войне
  1. Встреча Путина и Трампа на Аляске привела к одному неприятному последствию. Вот к какому
  2. Счет женщин шел на десятки. Подробности интимной жизни самого любвеобильного правителя на территории Беларуси
  3. Власти уверяют, что не будут поднимать пенсионный возраст. Экономист же считает, что другого выхода нет — и напрячься надо женщинам
  4. Беларусь заняла «почетное» место, а победил Вьетнам. В России прошел конкурс-заменитель «Евровидения»
  5. «Генеральное наступление осени по всем фронтам». Какой будет погода до конца сентября
  6. Французский тренч и сумка за тысячи долларов. Сколько стоит образ, в котором Наталья Петкевич посетила монастырь
  7. Окончательно «умерла» одна из фирм на автомобильном рынке. Появились новые подробности этой истории
  8. Погиб в ДТП, умер в изгнании, жив, но давно не дает интервью. Как сложились судьбы беларусских олигархов
  9. В Минске с крыши самого высокого жилого дома спрыгнул человек
  10. Мобильные операторы предупредили клиентов, что вводят изменения
  11. Путин сделал важный вывод после встречи с Трампом и, похоже, специально слил его в СМИ. О чем идет речь и зачем он это сделал


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.