Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Niech spie.dala. Silni Razem wściekli na Donalda Tuska gorące
"Niech spie.dala". "Silni Razem" wściekli na Donalda Tuska

Hasztag #SilniRazem po wielokrotnej kompromitacji nie jest już tak popularny na "X". Jednak stał się symbolem najbardziej zajadłej postawy "antypis". I potocznie tak są dziś nazywani najbardziej zajadli zwolennicy Donalda Tuska, Platformy Obywatelskiej, czy Romana Giertycha. A dzisiaj nie są z Donalda Tuska, mówić bardzo oględnie, zadowoleni.

Niemcy zazdroszczą polskim producentom kamperów Wiadomości
Niemcy zazdroszczą polskim producentom kamperów

Polskie marki kamperów zdobywają coraz większe uznanie na niemieckim rynku. Affinity, Freedo, Masuria i Vannado nie tylko przekonują klientów wysoką jakością, ale także zyskują lojalność dealerów.

„Zaraz zemdleję”. Dramatyczne wyznanie Nataszy Urbańskiej Wiadomości
„Zaraz zemdleję”. Dramatyczne wyznanie Nataszy Urbańskiej

Podróż powrotna z Czarnogóry do Polski okazała się dla Nataszy Urbańskiej jednym z najbardziej stresujących doświadczeń w życiu. Artystka opisała na Instagramie sytuację, do której doszło na pokładzie samolotu LOT lecącego z Podgoricy do Warszawy. Zemdlała, a - jak twierdzi - personel pokładowy zignorował nie tylko jej stan, ale i potrzeby pozostałych pasażerów.

Sukces tym razem nie dla Polek. Włoszki zbyt mocne w półfinale LN Wiadomości
Sukces tym razem nie dla Polek. Włoszki zbyt mocne w półfinale LN

Polskie siatkarki przegrały z Włoszkami 0:3 (18:25, 16:25, 14:25) w półfinale rozgrywanego w Łodzi turnieju finałowego Ligi Narodów. W niedzielę zagrają w meczu o trzecie miejsce z przegranym drugiego sobotniego półfinału, w którym Brazylia zmierzy się z Japonią.

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście gorące
Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.

Awaryjne lądowanie samolotu LOT w Warszawie z ostatniej chwili
Awaryjne lądowanie samolotu LOT w Warszawie

Z powodu sygnału o możliwej usterce lecący z Warszawy do Sofii samolot linii LOT musiał awaryjnie lądować na Lotnisku Chopina. - Lądowanie odbyło się w asyście służb. Maszyna wylądowała bezpiecznie - poinformował rzecznik prasowy Polskich Linii Lotniczych LOT Krzysztof Moczulski.

Wielki słup dymu nad Katowicami. Trwa dogaszanie Wiadomości
Wielki słup dymu nad Katowicami. Trwa dogaszanie

W sobotnie popołudnie, 26 lipca, w Katowicach doszło do pożaru w rejonie ul. Sądowej i Raciborskiej. Paliły się podkłady kolejowe składowane w pobliżu torowiska, w bezpośrednim sąsiedztwie budowy przy dworcu głównym PKP.

Niebezpieczny incydent w Krakowie. Kilkanaście osób poszkodowanych Wiadomości
Niebezpieczny incydent w Krakowie. Kilkanaście osób poszkodowanych

W piątkowy wieczór doszło do niebezpiecznego incydentu na przystanku tramwajowym przy ul. Bronowickiej w Krakowie. Z okna przejeżdżającego tramwaju ktoś rozpylił gaz pieprzowy w stronę grupy osób czekających na peronie. Jak informują poszkodowani, sytuacja miała miejsce około godziny 19:30.

Komunikat dla mieszkańców Rzeszowa z ostatniej chwili
Komunikat dla mieszkańców Rzeszowa

Prawie 250 tys. zł kosztować będzie dokumentacja projektowa nowego domu kultury, który powstanie w Rzeszowie na osiedlu Krakowska Południe przy ul. Stojałowskiego. Dokumentacja gotowa ma być w ciągu 10 miesięcy.

Czerwona flaga na Pomorzu i w Zachodniopomorskiem. GIS zakazuje kąpieli Wiadomości
Czerwona flaga na Pomorzu i w Zachodniopomorskiem. GIS zakazuje kąpieli

Czerwone flagi zakazujące wejścia do wody wiszą w sobotę w dwunastu kąpieliskach w województwach pomorskim i zachodniopomorskim. Powodem jest zakwit sinic.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane
Emerytury
Stażowe