Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Okrągły Stół opuścił dziś Pałac Prezydencki, ale decyzja zapadła lata temu pilne
Okrągły Stół opuścił dziś Pałac Prezydencki, ale decyzja zapadła lata temu

Przeniesienie Okrągłego Stołu z Pałacu Prezydenckiego wywołało falę komentarzy i politycznych emocji. Jak się jednak okazuje, nie była to decyzja obecnego prezydenta. Ustalenia w tej sprawie zapadły kilka lat temu, jeszcze za prezydentury Andrzeja Dudy.

Źródła: Podpisanie umowy UE-Mercosur opóźnione do stycznia z ostatniej chwili
Źródła: Podpisanie umowy UE-Mercosur opóźnione do stycznia

Przewodnicząca Komisji Europejskiej Ursula von der Leyen poinformowała przywódców na szczycie w Brukseli, że podpisanie umowy UE-Mercosur zostaje opóźnione do stycznia. Sprawę nagłośniły pragnące zachować anonimowość źródła w Brukseli.

Tusk: „Umowa UE-Mercosur jest bezpieczna”. Gembicka: „Niemiecki łańcuch jest krótki” z ostatniej chwili
Tusk: „Umowa UE-Mercosur jest bezpieczna”. Gembicka: „Niemiecki łańcuch jest krótki”

„Umowa z krajami Mercosur w obecnej wersji jest bezpieczna dla polskich rolników i polskich konsumentów” - stwierdził w czwartek premier Donald Tusk. „Nie jest idealnie, ale nie jest źle” - dodał. Przekonywał, że trudno będzie zablokować umowę, ponieważ... nie ma do tego większości.

Sejm ponownie uchwalił tę samą ustawę o kryptowalutach z ostatniej chwili
Sejm ponownie uchwalił tę samą ustawę o kryptowalutach

Ten sam projekt, te same zapisy i ta sama linia sporu. Rząd ponownie przeprowadził dziś przez Sejm ustawę o rynku kryptoaktywów, mimo wcześniejszego weta prezydenta i sprzeciwu opozycji.

Zełenski rozpoczął wizytę w Polsce. Będzie podjęty temat ekshumacji na Wołyniu z ostatniej chwili
Zełenski rozpoczął wizytę w Polsce. Będzie podjęty temat ekshumacji na Wołyniu

Polityka historyczna, bezpieczeństwo i sprawy gospodarcze będą głównymi tematami rozmów prezydentów Polski i Ukrainy. Wołodymyr Zełenski po raz pierwszy spotka się z Karolem Nawrockim w Pałacu Prezydenckim.

Umowa ws. pierwszej w historii UE listy bezpiecznych krajów pochodzenia prawie na finiszu z ostatniej chwili
Umowa ws. pierwszej w historii UE listy bezpiecznych krajów pochodzenia prawie na finiszu

Negocjatorzy Parlamentu i Rady UE osiągnęli porozumienie polityczne w sprawie utworzenia unijnej listy bezpiecznych krajów pochodzenia, aby przyspieszyć rozpatrywanie wniosków o azyl.

Waszyngton stawia na Polskę. Pełny udział w szczycie G20 polityka
Waszyngton stawia na Polskę. Pełny udział w szczycie G20

Polska została zaproszona do udziału w przyszłorocznym szczycie G20 w Miami jako jedyny gość uczestniczący w obradach w pełnym zakresie. Administracja USA podkreśla, że nasz kraj zajmuje dziś należne miejsce wśród największych gospodarek świata.

Rutte: NATO jest zjednoczone i gotowe, by bronić naszego bezpieczeństwa z ostatniej chwili
Rutte: NATO jest zjednoczone i gotowe, by bronić naszego bezpieczeństwa

NATO jest zjednoczone i gotowe, by odstraszać agresję i bronić naszego bezpieczeństwa i wolności – zapewnił w czwartek sekretarz generalny NATO Mark Rutte po spotkaniu z szefem MON, wicepremierem Władysławem Kosiniakiem-Kamyszem. Zadeklarował też dalsze wsparcie dla Ukrainy.

Zniewagi i naruszenie nietykalności taksówkarza. Są zarzuty wobec radnej KO Wiadomości
Zniewagi i naruszenie nietykalności taksówkarza. Są zarzuty wobec radnej KO

Prokuratura postawiła radnej Koalicji Obywatelskiej zarzuty znieważenia i naruszenia nietykalności cielesnej taksówkarza. Polityk nie przyznała się do winy i odmówiła składania wyjaśnień.

Francuski „Doktor Śmierć” skazany na dożywocie. Sąd uznał, że z premedytacją truł pacjentów z ostatniej chwili
Francuski „Doktor Śmierć” skazany na dożywocie. Sąd uznał, że z premedytacją truł pacjentów

Były anestezjolog został skazany na dożywocie za celowe zatrucie 30 pacjentów, w tym 12 ze skutkiem śmiertelnym. Sprawę opisało BBC.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane