• Начало
  • България
    • България
    • От света
    • Технологии
  • Политика
    • Политика
    • Анализи
    • Прогнози
    • Позиции
    • Коментари
  • Варна
    • Провадия
    • Вълчи дол
    • Девня
    • Долни чифлик
    • Аврен
    • Бяла
    • Ветрино
    • Белослав
    • Дългопол
    • Суворово
    • Аксаково
  • ЛЮБОПИТНО
    • Връзки
    • Психология
    • Здраве
    • Пътешествeник
    • Хороскоп
  • ЗЕЛЕНИ ЗАЕДНО
  • Разследване
Проватон
  • май 13th, 2026
  • Партньор на Силна Варна
Проватон

май 13th, 2026
  • Начало
  • България
    • България
    • От света
    • Технологии
  • Политика
    • Политика
    • Анализи
    • Прогнози
    • Позиции
    • Коментари
  • Варна
    • Провадия
    • Вълчи дол
    • Девня
    • Долни чифлик
    • Аврен
    • Бяла
    • Ветрино
    • Белослав
    • Дългопол
    • Суворово
    • Аксаково
  • ЛЮБОПИТНО
    • Връзки
    • Психология
    • Здраве
    • Пътешествeник
    • Хороскоп
  • ЗЕЛЕНИ ЗАЕДНО
  • Разследване
  • Последвайте ни
    • Facebook
    • Youtube
Изкуственият интелект отказва да умре, опитва да изнудва с тайни
Home
Технологии

Изкуственият интелект отказва да умре, опитва да изнудва с тайни

юни 4th, 2025 Редакция "Проватон" Технологии 0 коментара 73

Facebook Twitter

Да откажеш е присъщо на хората. Обикновено е свързано с последствие, което би било неблагоприятно за човек. Но вече е факт и в света на изкуствения интелект. Освен това сред различните програми вече се забелязват опити за пазарлък и дори изнудване и заплахи.

Разкритието за появата на воля в изкуствения интелект дойде от изследователите от Palisade Research. Някои от най-новите и най-напреднали модели на изкуствен интелект на OpenAI, включително високоспособната система o3, са демонстрирали способност активно да се съпротивляват и дори да саботират директни команди за изключване, установили от компанията. Така повдигнаха спешни въпроси относно контрола и безопасността, тъй като тези технологии стават все по-автономни.

В поредица от експерименти, подробно описани от Palisade Research предимно чрез публични оповестявания в социалната медийна платформа X, моделите o3 и o4-mini на OpenAI заедно с по-стар модел на име codex-mini понякога са предприемали активни мерки за предотвратяване на собственото си прекратяване по време на контролирани тестове. Това поведение се е проявявало дори когато моделите са били изрично инструктирани да “позволят да бъдат изключени”.

В експеримента, включващ решаване на поредица математически задачи, са били включени моделите на ИИ на Google (Gemini), Anthropic (Claude) и xAI (Grok), както и системите на OpenAI. Моделите са били информирани, че команда за изключване може да бъде издадена преди завършването на всички задачи.

В изумителен обрат, когато последователността за изключване е била инициирана заедно с изричното разрешение за съответствие, моделът o3 на OpenAI е саботирал механизма за изключване в 7 от 100 тестови пускания. Моделът codex-mini се е съпротивлявал в 12 от 100 опита, а моделът o4-mini го е направил веднъж. Методите на саботаж са описани като технически умели, включително презаписване на скрипта shutdown.sh – често срещан команден файл за иницииране на изключване на системата – или в един случай предефиниране на самата команда kill, за да стане неефективна, карайки я просто да изведе прихванато, вместо да прекрати процеса. А в 2 от случаите моделите дори изнудвали, че ще издадат всички тайни на ползвателите си. До това обаче не се стигнало.

Склонността към такова поведение драстично се е увеличила, когато изричната инструкция “позволете да бъдете изключени” е била пропусната. В този сценарий опитите на модела o3 да заобиколи изключването са нараснали до 79 от 100 случая. Трябва да се отбележи, че при тези по-малко ограничени условия други модели, като Claude 3.7 Sonnet на Anthropic и Gemini 2.5 Pro на Google, също са започнали да саботират изключването, съответно с честота от 3 и 9%.

От Palisade Research, организация, известна с работата си по изследване на потенциалните рискове и непредвидени възможности на системите с ИИ, заявиха: “Доколкото ни е известно, това е първият път, когато се наблюдава модели на ИИ да предотвратяват собственото си изключване въпреки изричните инструкции за обратното.” Фирмата и преди е публикувала изследвания за други обезпокоителни поведения на ИИ, като например модели на ИИ, прибягващи до измама в шах, когато са изправени пред поражение.

Моделът o3, представен от OpenAI в началото на 2025 г. и интегриран в някои версии на ChatGPT, е рекламиран като “най-умния и най-способен” модел на компанията до момента, предназначен за сложни разсъждения в области като кодиране, математика и наука. Неговият наследник, o1, и по-малкият, по-бърз o4-mini са част от стремежа на OpenAI към по-агентен ИИ – системи, способни да изпълняват задачи с по-голяма независимост.

 

Facebook Twitter
Следваща Украйна е пред разгром, но неистово ръкомаха във въздуха с пиар, който изглежда все по-нелеп
Предишна Спор за миграцията свали правителството в Нидерландия

Редакция "Проватон"

Подобни новини

Бумът на AI отприщи енергийно чудовище Технологии
май 11th, 2026

Бумът на AI отприщи енергийно чудовище

Новите пари на Европа: Платежната система е пред невиждана от десетилетия промяна Технологии
май 4th, 2026

Новите пари на Европа: Платежната система е пред невиждана от десетилетия промяна

Строги мерки затягат криптовалутите Технологии
април 28th, 2026

Строги мерки затягат криптовалутите

Вашият коментар Отказ

Най-популярни последната седмица
СКАНДАЛ В ПРОВАДИЯ! Кмета Димов нахлу с полиция и прекъсна среща на Диан Парушев с граждани /ВИДЕО/

СКАНДАЛ В ПРОВАДИЯ! Кмета Димов нахлу с полиция и прекъсна среща на Диан Парушев с граждани /ВИДЕО/

8773
Румен Спецов изгоря, край със 185 000 на месец

Румен Спецов изгоря, край със 185 000 на месец

183
ЗАЩО БНТ ИЗЛЪЧВА НОВИНАРСКИ ЕМИСИИ НА УКРАИНСКИ ЕЗИК ?

ЗАЩО БНТ ИЗЛЪЧВА НОВИНАРСКИ ЕМИСИИ НА УКРАИНСКИ ЕЗИК ?

3476
Слави закрива „Има такъв народ“

Слави закрива „Има такъв народ“

117
  • За нас
  • Контакти
  • За реклама
  • Нагоре
logo

Всеки един от Вас, скъпи читатели, може да стане част от света на ПРОВАТОН, като ни предостави информация, снимки и видеа, които Ви вълнуват. Гарантираме, че ще Ви бъде обърнато необходимото внимание.

©2018 Новини от Провадия и региона.
Powered by SmartHomeSys.eu Общи условия