Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Konferencja prasowa Karola Nawrockiego: Dyskutowaliśmy o uruchomieniu art. 4 NATO z ostatniej chwili
Konferencja prasowa Karola Nawrockiego: "Dyskutowaliśmy o uruchomieniu art. 4 NATO"

W dowództwie operacyjnym spotkałem się także z panem premierem Donaldem Tuskiem. Tam podjąłem decyzję o zorganizowaniu specjalnej narady w Biurze Bezpieczeństwa Narodowego. (...) W czasie tego spotkania dyskutowaliśmy o możliwości uruchomienia artykułu 4 Traktatu Północnoatlantyckiego - powiedział prezydent podczas konferencji prasowej związanej z bezprecedensowym naruszeniem polskiej przestrzeni powietrznej.

Drony nad Polską. Jest nowy komunikat armii gorące
Drony nad Polską. Jest nowy komunikat armii

Oficjalnie potwierdzono naruszenie polskiej przestrzeni powietrznej przez wojskowe drony. Jest nowy komunikat Dowództwa Operacyjnego Rodzajów Sił Zbrojnych.

MEN wydało komunikat w związku z dzisiejszymi wydarzeniami z ostatniej chwili
MEN wydało komunikat w związku z dzisiejszymi wydarzeniami

Dowództwo Operacyjne Rodzajów Sił Zbrojnych przekazało po godz. 7.30., że operowanie polskiego i sojuszniczego lotnictwa związane z naruszeniami polskiej przestrzeni powietrznej zakończyło się. Komunikat dla rodziców i uczniów wydał MEN.

Drony nad Polską. Jest komunikat RCB z ostatniej chwili
Drony nad Polską. Jest komunikat RCB

W nocy z wtorku na środę kilkanaście dronów naruszyło naszą przestrzeń powietrzną podczas zmasowanego ataku na Ukrainę. Dowództwo Operacyjne Sił Zbrojnych mówi o „bezprecedensowej skali” incydentu.

Wydano alert mobilizacyjny dla WOT z ostatniej chwili
Wydano alert mobilizacyjny dla WOT

Polska znalazła się w stanie najwyższej gotowości po tym, jak w nocy z wtorku na środę rosyjskie drony wielokrotnie naruszyły naszą przestrzeń powietrzną. Jak przekazało Dowództwo Operacyjne Rodzajów Sił Zbrojnych, "doszło do bezprecedensowego w skali" incydentu, który bezpośrednio zagrażał bezpieczeństwu obywateli. W trybie alarmowym uruchomiono procedury obronne i zaostrzono mobilizację Wojsk Obrony Terytorialnej.

Drony nad Polską. Jest komunikat prezydenta RP Karola Nawrockiego z ostatniej chwili
Drony nad Polską. Jest komunikat prezydenta RP Karola Nawrockiego

Oficjalnie potwierdzono naruszenie polskiej przestrzeni powietrznej przez wojskowe drony. Jest komunikat prezydenta RP Karola Nawrockiego.

Wojsko zestrzeliło drony nad Polską z ostatniej chwili
Wojsko zestrzeliło drony nad Polską

W nocy z wtorku na środę miało miejsce bezprecedensowe naruszenie polskiej przestrzeni powietrznej. Kilkanaście, a według niektórych źródeł nawet około 20 dronów wtargnęło nad terytorium Polski, przekraczając przestrzeń powietrzną na wschodniej granicy. Część z nich została zestrzelona, a w kraju ogłoszono najwyższy poziom gotowości służb i sił zbrojnych.

Media podają informację o dronach lecących w kierunku Zamościa. Jest komunikat armii z ostatniej chwili
Media podają informację o dronach lecących w kierunku Zamościa. Jest komunikat armii

Między innymi amerykańska stacja Sky News podaje informacje, których źródłem mają być siły zbrojne Ukrainy, o naruszeniu polskiej przestrzeni powietrznej przez rosyjskie drony. Jest komunikat Dowództwa Operacyjnego Rodzajów Sił Zbrojnych.

Będzie nowy wicepremier w rządzie Tuska. Padło nazwisko z ostatniej chwili
Będzie nowy wicepremier w rządzie Tuska. Padło nazwisko

We wtorkowej rozmowie z Radiem ZET minister funduszy i polityki regionalnej Katarzyna Pełczyńska-Nałęcz poinformowała, że Polska 2050 otrzyma do rozdysponowania stanowisko wicepremiera po odejściu Szymona Hołowni ze stanowiska marszałka Sejmu.

Były minister spraw zagranicznych Ukrainy Dmytro Kułeba uciekł do Polski? gorące
Były minister spraw zagranicznych Ukrainy Dmytro Kułeba uciekł do Polski?

Jak wynika z wywiadu jakiego były minister spraw zagranicznych Ukrainy udzielił Corriere della Sera, Dmytro Kułeba miał uciec z Ukrainy ze względu na nowe ukraińskie prawo, które ma zakazywać wyjazdy z Ukrainy byłym dyplomatom. Kułeba pojawił się w Krakowie. Teraz jego rzecznik przedstawia nieco inną wersję.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane
Emerytury
Stażowe