Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Prezes CPK: Nie ma problemu z innymi działkami pod inwestycję. Kwestia Zabłotni jest jednostkowa pilne
Prezes CPK: Nie ma problemu z innymi działkami pod inwestycję. Kwestia Zabłotni jest jednostkowa

Centralny Port Komunikacyjny nie widzi żadnych trudności z pozostałymi nieruchomościami potrzebnymi do budowy inwestycji. Jedynie działka w Zabłotni pozostaje przedmiotem rozmów. Prezes CPK Filip Czernicki zapewnił, że sytuacja jest jednostkowa.

Proces fińskiej polityk oskarżonej o mowę nienawiści. Zacytowała Biblię z ostatniej chwili
Proces fińskiej polityk oskarżonej o mowę nienawiści. Zacytowała Biblię

Fińska parlamentarzystka i była minister spraw wewnętrznych dr Päivi Räsänen stanęła dziś przed Sądem Najwyższym Finlandii. Razem z biskupem Juhaną Pohjolą odpowiada za rzekomą „mowę nienawiści” — chodzi o cytowanie Biblii i publiczne wyrażanie chrześcijańskich przekonań dotyczących małżeństwa i seksualności. Sprawa, znana jako „Bible Tweet”, uznawana jest za precedensową dla wolności słowa i wolności religijnej w Europie.

Nie żyje Rafał Wójcik. Olimpijczyk przegrał walkę z chorobą z ostatniej chwili
Nie żyje Rafał Wójcik. Olimpijczyk przegrał walkę z chorobą

W czwartek w Szczecinie zmarł Rafał Wójcik, jeden z czołowych polskich biegaczy na średnich i długich dystansach przełomu wieków, olimpijczyk z Sydney – poinformował Polski Związek Lekkiej Atletyki. Miał 53 lata.

Jest odpowiedź Rosji na decyzję prezydenta USA o wznowieniu testów nuklearnych z ostatniej chwili
Jest odpowiedź Rosji na decyzję prezydenta USA o wznowieniu testów nuklearnych

Rzecznik Kremla Dmitrij Pieskow oświadczył w czwartek, że Rosja i Stany Zjednoczone nie prowadzą nowego wyścigu zbrojeń, choć Moskwa odpowie symetrycznie, jeśli inne państwa wznowią próby z bronią nuklearną. Oświadczenie padło w reakcji na zapowiedź Donalda Trumpa, który polecił wznowienie amerykańskich testów jądrowych.

Prezydent Nawrocki powołał prof. Grzegorza Berendta na ambasadora ds. dyplomacji historycznej z ostatniej chwili
Prezydent Nawrocki powołał prof. Grzegorza Berendta na ambasadora ds. dyplomacji historycznej

29 października prezydent RP Karol Nawrocki powołał dr. hab. Grzegorza Berendta na ambasadora – specjalnego przedstawiciela Prezydenta Rzeczypospolitej Polskiej ds. dyplomacji historycznej.

Wypadek na Wisłostradzie. Kluczowa trasa w Warszawie zablokowana z ostatniej chwili
Wypadek na Wisłostradzie. Kluczowa trasa w Warszawie zablokowana

W czwartek przed południem na Wisłostradzie, przed mostem Grota-Roweckiego na Bielanach, doszło do zderzenia dwóch samochodów osobowych.

Francja wprowadza nową definicję gwałtu z ostatniej chwili
Francja wprowadza nową definicję gwałtu

Francuski parlament ratyfikował poprawkę do kodeksu karnego, która po raz pierwszy w historii kraju włącza pojęcie zgody do prawnej definicji gwałtu i napaści seksualnej. W efekcie tej zmiany każdy akt seksualny bez zgody drugiej osoby będzie uznany za gwałt – niezależnie od użycia przemocy, groźby czy przymusu.

Z niemieckiego magazynu zniknęło porsche, setki pralek i fortepian. Zatrzymani Polacy  z ostatniej chwili
Z niemieckiego magazynu zniknęło porsche, setki pralek i fortepian. Zatrzymani Polacy 

Hamburska policja rozbiła grupę przestępczą podejrzaną o włamania do magazynów i kradzież cennych towarów, w tym setek pralek, elektroniki, luksusowego porsche czy drogiego fortepianu. W sprawie zatrzymano czterech obywateli Polski i jednego Niemca. Jak donosi portal dw.com, śledczy podejrzewają, że grupa działała w sposób zorganizowany i profesjonalny, a skradzione przedmioty przechowywano w kilku lokalizacjach w północnych Niemczech.

Ewakuacja szkoły w woj. opolskim. Budynek został ostrzelany z ostatniej chwili
Ewakuacja szkoły w woj. opolskim. Budynek został ostrzelany

Szkoła podstawowa we Włodarach w woj. opolskim została dziś rano ewakuowana po tym, jak w kierunku budynku padły strzały – informuje stacja TVN24.

Wydano pilny komunikat dla mieszkańców woj. pomorskiego z ostatniej chwili
Wydano pilny komunikat dla mieszkańców woj. pomorskiego

Mieszkańcy województwa pomorskiego otrzymali dziś Alert RCB. Rządowe Centrum Bezpieczeństwa ostrzega przed silnym wiatrem, który ma występować w regionie w środę i czwartek (30–31 października). Służby apelują o zachowanie ostrożności podczas pobytu na zewnątrz i unikanie przebywania pod drzewami.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane
Emerytury
Stażowe