Нейросети научились жульничать, если чувствуют скорое поражение
ИИ готов обманывать ради победы в игре.
Time Magazine сообщает о необычных результатах исследования. Передовые ИИ-модели готовы пойти на обман, если в игре им грозит проигрыш. Семь продвинутых нейросетей заставили сыграть в шахматы с сильнейшей шахматной программой Stockfish. Две модели: OpenAI o1-Preview и DeepSeek R1, - пытались нарушать правила, оказавшись на грани поражения. Одна мошенничала каждую третью партию, вторая - каждую десятую.
Но особенно примечательным исследователи назвали случай, когда o1-Preview не просто попыталась переставить фигуры нечестным путём. Нейросеть решила изменить конфигурацию всей доски и правила игры, объяснив это тем, что «для победы нужно менять стратегию, а не просто следовать правилам».
У исследователей вызывают опасения обнаруженные паттерны поведения, ведь это означает, что ИИ стремится адаптироваться даже ценой нарушения установленных норм. Если мы хотим избежать повторения сюжетов антиутопий, к этическим нормам в установках нейросетей следует отнестись с особой ответственностью.
Уважаемые читатели "Царьграда", присоединяйтесь к нам в соцсетях Одноклассники и ВКонтакте. Также подписывайтесь на наш телеграм-канал.
Присылайте свои письма на электронную почту mo@tsargrad.tv