Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Wojna na Bliskim Wschodzie. LOT wydał pilny komunikat z ostatniej chwili
Wojna na Bliskim Wschodzie. LOT wydał pilny komunikat

Polskie Linie Lotnicze LOT odwołały rejsy do Dubaju do 6 marca oraz anulowały dwa kolejne loty do Rijadu, zaplanowane na 12 i 15 marca – poinformował we wtorek rzecznik narodowego przewoźnika Krzysztof Moczulski. Dodał, że połączenia do Tel Awiwu pozostają zawieszone do 18 marca włącznie.

Sojusz nuklearny Paryż - Berlin. Macron i Merz ogłaszają wspólne działania polityka
Sojusz nuklearny Paryż - Berlin. Macron i Merz ogłaszają wspólne działania

Francja zapowiada rozbudowę arsenału jądrowego, a Niemcy oficjalnie wchodzą do wspólnej inicjatywy odstraszania. Po wystąpieniu Emmanuela Macrona opublikowano wspólne oświadczenie z Friedrichem Merzem o utworzeniu francusko-niemieckiej grupy ds. broni jądrowej.

Skokowy wzrost cen paliw w hurcie. Ponad 40 groszy na litrze z ostatniej chwili
Skokowy wzrost cen paliw w hurcie. Ponad 40 groszy na litrze

Ceny ropy naftowej reagują na wojnę na Bliskim Wschodzie, a w Polsce hurtowe ceny paliw poszły w górę. W przypadku oleju napędowego jest to ponad 40 groszy na litrze.

Nowacka zapowiada „rzeczy prawdziwe, a nie udawane”. Będzie edukacja z wojskiem Wiadomości
Nowacka zapowiada „rzeczy prawdziwe, a nie udawane”. Będzie edukacja z wojskiem

Resort edukacji zapowiada gruntowną przebudowę przedmiotu edukacja dla bezpieczeństwa. Ma zmienić się jego nazwa, zakres i formuła – według minister Barbary Nowackiej szkoły potrzebują „rzeczy prawdziwych, a nie udawanych”.

Wojna na Bliskim Wschodzie. Biuro podróży TUI wydało komunikat z ostatniej chwili
Wojna na Bliskim Wschodzie. Biuro podróży TUI wydało komunikat

– Biuro podróży TUI rozpocznie we wtorek sprowadzanie do kraju niemieckich klientów, którzy utknęli na Bliskim Wschodzie z powodu wojny w regionie – poinformował prezes firmy Sebastian Ebel w rozmowie z telewizją NTV. Pierwsze samoloty wylądują w Monachium.

Nie żyje Adam Chełstowski. Znany fotoreporter zmarł nagle z ostatniej chwili
Nie żyje Adam Chełstowski. Znany fotoreporter zmarł nagle

Nie żyje Adam Chełstowski, autor setek legendarnych zdjęć polityków, fotoreporter sejmowy. Zmarł nagle, w wieku 50 lat.

Imigrant brutalnie pobił w Kutnie przypadkową kobietę pilne
Imigrant brutalnie pobił w Kutnie przypadkową kobietę

Do brutalnej napaści na kobietę doszło w centrum Kutna. Policja zatrzymała 28-letniego obywatela Kolumbii, który jest podejrzewany o dokonanie ataku.

Nowy ambasador Rosji w Polsce. Putin wydał dekret z ostatniej chwili
Nowy ambasador Rosji w Polsce. Putin wydał dekret

Rosyjski przywódca Władimir Putin wyznaczył dyplomatę Gieorgija Michnę na stanowisko ambasadora Rosji w Polsce – wynika z dekretu opublikowanego we wtorek na oficjalnym portalu aktów prawnych Kremla.

Komunikat Straży Granicznej. Pilne doniesienia z granicy z ostatniej chwili
Komunikat Straży Granicznej. Pilne doniesienia z granicy

Straż Graniczna opublikowała najnowsze dane dotyczące sytuacji na granicach Polski. 2 marca 2026 r. Straż Graniczna skontrolowała łącznie ponad 7 tys. osób na granicach z Litwą i Niemcami. Poinformowano też o sytuacji na granicy z Białorusią.

Francuska broń jądrowa dla Polski? Szef BBN studzi oczekiwania z ostatniej chwili
Francuska broń jądrowa dla Polski? Szef BBN studzi oczekiwania

Szef Biura Bezpieczeństwa Narodowego Sławomir Cenckiewicz sceptycznie ocenia możliwość realnego objęcia Polski francuskim odstraszaniem nuklearnym. Jego zdaniem Paryż bardzo pilnuje pełnej kontroli nad własnym arsenałem.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane