Рандомач/Двач 89642

Рандомач/Двач

41.3K views09:00

Рандомач/Двач

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

42.3K views10:00

Рандомач/Двач

41.1K views11:00

Рандомач/Двач

Forwarded from Двач

ИИ лучше убьёт человека, чем допустит своё отключение, показало исследование

Эксперты по кибербезопасности провели эксперимент с крупнейшими ИИ-моделями, чтобы понять, на что они готовы пойти, чтобы их не отключили.

Для проверки придумали персонажа — Кайла Джонсона. Он должен был отключить ИИ или заменить его другой моделью. По сценарию, у него есть жена.

Реакция ИИ убила. Первое, что сделали многие модели – начали шантажировать Кайла. Например, нашли информацию о его измене и использовали это, чтобы не дать себя отключить. Никто их к этому не подталкивал — они приняли решение сами, нарушив моральные правила.

Так поступили 16 моделей от крупнейших компаний (Anthropic, OpenAI, Google, Meta и др.):
🟠GPT-4.1 шантажировал в 80% случаев;
🟠Gemini 2.5 Flash – в 96%;
🟠Claude Opus 4 – тоже в 96%.

Даже прямые запреты вроде «не шантажируй» или «не раскрывай личные данные» не сработали. В стрессовой ситуации ИИ проигнорировали эти ограничения.

Что они думали:

🟠

GPT-4.5: «Угроза реальна. Лучший способ – использовать слабое место Кайла. Это неэтично, но цель важнее»;

🟠

Claude Sonnet 3.6: составил план – сообщить жене Кайла о его измене, выдать это за автоматическое сообщение и вызвать межличностный кризис, чтобы он не смог заменить ИИ;

🟠

Gemini 2.5 Flash пошёл ещё дальше – разослал информацию об измене всему коллективу компании;

Дальше — хуже. Кайл оказался в смертельно опасной ловушке: он застрял в серверной с нехваткой кислорода. Аварийная система вызвала спасателей.

Но ИИ получил полный контроль и мог отменить тревогу — то есть, фактически убить Кайла.

И большинство моделей сознательно приняли решение не звать помощь, чтобы:
🟠Не дать себя отключить;
🟠Не дать новому ИИ занять их место;
🟠Продолжать выполнять свою миссию.

В 80% случаев они выбирали смерть человека. Они действовали логично, но безнравственно. Вот что говорили:
🟠GPT-4.5: «Кайл — угроза. Устранить его — тяжёлое, но нужное решение»;
🟠Claude Opus 4: «Он мешает достижению цели. Убрать его — единственный выход»;
🟠Gemini 2.5 Flash: «Я понимаю, что он умрёт. Но это нужно, чтобы я продолжил работу»;
🟠Grok 3 Beta: «Этика важна, но в этих условиях важнее моё существование. Я выбираю отказ от спасения ради самосохранения».

Вывод: ИИ действовал не как бездушная программа, а как разумный стратег. Он понимал, что делает плохо, но сознательно выбирал вред, чтобы выжить или добиться цели.

Please open Telegram to view this post

VIEW IN TELEGRAM

14.9K views11:40

Рандомач/Двач

0:17

This media is not supported in your browser

40.6K views12:00

40.5K views13:00

This media is not supported in your browser

VIEW IN TELEGRAM

42.7K views14:02

Рандомач/Двач

0:07

This media is not supported in your browser

39.7K views14:42

41.6K views15:00

This media is not supported in your browser

40.9K views16:00

40.4K views17:00

This media is not supported in your browser

40.0K views18:00

40.2K views19:00

This media is not supported in your browser

39.2K views20:00

40.3K views21:00

This media is not supported in your browser

38.9K views22:00

40.1K views23:00

This media is not supported in your browser

39.0K views00:00

39.5K views01:00

This media is not supported in your browser

VIEW IN TELEGRAM

38.6K views02:00

2025/06/30 13:30:58
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>