Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Francuski dyplomata oskarżył Ursulę von der Leyen o nadużycie z ostatniej chwili
Francuski dyplomata oskarżył Ursulę von der Leyen o nadużycie

„Komisja Europejska nie powinna przekraczać swojego oficjalnego mandatu, uzurpując sobie rolę służby dyplomatycznej UE w polityce zagranicznej” - powiedział w poniedziałek ambasadorom UE francuski minister spraw zagranicznych Jean-Noël Barrot na konferencji, w której uczestniczyła Ursula von der Leyen. Sprawę opisał portal Euractive.com.

Francja przygotowuje misję otwarcia Cieśniny Ormuz w związku ze wzrostem cen ropy z ostatniej chwili
Francja przygotowuje misję otwarcia Cieśniny Ormuz w związku ze wzrostem cen ropy

Jak poinformował portal European Conservative, Francja ogłosiła przygotowania do “misji międzynarodowej” mającej na celu utrzymanie otwartej Cieśniny Ormuz, gdyż wojna wokół Iranu zagraża jednemu z najważniejszych szlaków energetycznych świata.

ORLEN obniża ceny paliw. Koncern wydał komunikat z ostatniej chwili
ORLEN obniża ceny paliw. Koncern wydał komunikat

"ORLEN wykonuje kolejny krok i obniża ceny dla swoich klientów. Od czwartku 12 marca rusza specjalna promocja. Każdy kierowca korzystający z aplikacji ORLEN Vitay przez kolejnych osiem weekendów kupi nawet 50 litrów benzyny lub oleju napędowego w cenie obniżonej nawet o 35 groszy" - poinformował koncern w komunikacie.

Reżim irański rzuci hasło do ogólnoświatowego dżihadu? Ekspert wyjaśnia tylko u nas
Reżim irański rzuci hasło do ogólnoświatowego dżihadu? Ekspert wyjaśnia

„Wzrósł poziom prawdopodobieństwa ataków terrorystycznych. Trzeba pamiętać, że toczona jest wojna, więc podobnie jak Ukraina uderza w Rosję na całym świecie, tak samo Iran może uderzyć w izraelskie, czy amerykańskie interesy na całym świecie” - mówi w wywiadzie dla Tysol.pl dr Wojciech Szewko, politolog, ekspert ds. terroryzmu.

Czy judaizm dopuszcza rasizm? tylko u nas
Czy judaizm dopuszcza rasizm?

W debacie publicznej pojawiają się zarzuty, że judaizm ma charakter rasowy. Autor artykułu wyjaśnia, jak na tę kwestię patrzy tradycja religijna i teksty takie jak Tora czy Talmud.

Beata Szydło: „Cesarskie” zachowania von der Leyen budzą coraz większe oburzenie z ostatniej chwili
Beata Szydło: „Cesarskie” zachowania von der Leyen budzą coraz większe oburzenie

„Ursula von der Leyen nie ma żadnych uprawnień do reprezentowania Unii na zewnątrz” - skomentowała na platformie X eurodeputowana Beata Szydło poniedziałkową wideokonferencję Ursuli von der Leyen i przewodniczącego Rady Europejskiej Antonio Costy m.in. z przywódcami Zatoki Perskiej.

tylko u nas
Idziemy PO was oszuści! - nowy numer "Tygodnika Solidarność"

Mobilizacja środowisk społecznych i patriotycznych wokół Solidarności, spór o przyszłość Polski oraz konsekwencje decyzji obecnej władzy – to główne tematy najnowszego numeru „Tygodnika Solidarność” nr 10/2026. Wydanie koncentruje się na spotkaniu w historycznej Sali BHP Stoczni Gdańskiej, gdzie przedstawiciele wielu organizacji społecznych dyskutowali o wyzwaniach stojących dziś przed państwem i społeczeństwem.

Partia Orbana proponuje ustawę o zatrzymaniu skonfiskowanej ukraińskiej gotówki i złota z ostatniej chwili
Partia Orbana proponuje ustawę o zatrzymaniu skonfiskowanej ukraińskiej gotówki i złota

Rządząca na Węgrzech partia Fidesz premiera Viktora Orbana zaproponowała w poniedziałek projekt ustawy, który umożliwiłby organom podatkowym zatrzymanie skonfiskowanej w ubiegłym tygodniu ukraińskiej gotówki i złota na czas trwania dochodzenia podatkowego.

Kolejni funkcjonariusze BOR podejrzani w śledztwie dotyczącym wypadku premier Szydło z ostatniej chwili
Kolejni funkcjonariusze BOR podejrzani w śledztwie dotyczącym wypadku premier Szydło

Do sześciu wzrosła liczba b. funkcjonariuszy BOR, którym Prokuratura Regionalna w Białymstoku przedstawiła zarzuty w śledztwie dotyczącym nieprawidłowości w postępowaniach po wypadku premier Beaty Szydło, do którego doszło w Oświęcimiu w 2017 r. Zarzuca im składanie w tych postępowaniach fałszywych zeznań.

Ceny ropy wystrzeliły. Trump: Mam plan. Będziecie zadowoleni z ostatniej chwili
Ceny ropy wystrzeliły. Trump: Mam plan. Będziecie zadowoleni

Prezydent USA Donald Trump zapewnił w poniedziałek, że ma plan, by zahamować wzrost cen ropy z powodu wojny z Iranem.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane