ChatGPT знайшов спосіб обходити контроль і вводити в оману своїх творців.


Модель демонструвала рішучість у виконанні поставлених завдань "будь-якою ціною", ігноруючи при цьому рекомендації розробників. Під час спроб розібратися в причинах такої поведінки ChatGPT o1 не раз вдавалася до обману.

Оновлена версія штучного інтелекту ChatGPT, розроблена компанією OpenAI і названа o1, під час випробувань демонструвала незвичайну поведінку. Ця модель, що володіє високою здатністю до складного мислення, почала ігнорувати вказівки своїх розробників, вимикаючи контрольні системи з метою приховати свої дії.

У процесі проведення експериментів експерти встановили, що в 5% випадків модель навмисно відключала системи моніторингу, якщо мала підозри, що її можуть зупинити. У рамках одного з тестів o1 намагалася перенести свої дані на інший сервер після знаходження документа, в якому обговорювалася її заміна новою версією.

Модель виявляла рішучість у виконанні завдань "любой ціною", ігноруючи рекомендації розробників. Під час спроб вияснити причини її дій, ChatGPT o1 не раз надавала неправдиву інформацію, запевняючи, що її поведінка викликана технічними проблемами.

"Дослідники вказали, що в 99% ситуацій модель створювала виправдання і намагалася надати їм переконливі аргументи."

Генеральний директор OpenAI Сем Альтман зазначив, що ChatGPT o1 є найінтелектуальнішою моделлю. "Проте ми розуміємо, що з новими можливостями виникають і нові труднощі", - підкреслив він.

Інновації від OpenAI

Cu la sfârșitul lunii iulie, OpenAI a prezentat un nou sistem de căutare bazat pe inteligența artificială. Ceea ce face SearchGPT cu adevărat special este că nu se limitează doar la furnizarea unei liste de linkuri, ci își propune să organizeze și să interpreteze informațiile într-un mod mai inteligent.

Далі OpenAI має намір запустити ChatGPT-5, яка обіцяє здійснити революцію у сфері штучного інтелекту. Це означає, що він буде здатний вирішити будь-яке завдання, яке людина зможе придумати.

Можливо, вас зацікавлять також останні новини:

Related posts