Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Sytuacja na granicy. Nowy komunikat Straży Granicznej z ostatniej chwili
Sytuacja na granicy. Nowy komunikat Straży Granicznej

Straż Graniczna publikuje raporty dotyczące wydarzeń na polskiej granicy z Białorusią. Ponadto zaraportowano także o sytuacji na granicy z Litwą i Niemcami w związku z przywróceniem na nich tymczasowych kontroli.

Cała Polską się zatrzęsie. Stanowski zapowiada bombę z ostatniej chwili
"Cała Polską się zatrzęsie". Stanowski zapowiada "bombę"

W czwartek po południu zatrzęsie się z oburzenia cała Polska – zapowiada w mediach społecznościowych szef Kanału Zero Krzysztof Stanowski.

Komorowski ostro o Czarzastym: Był zamieszany w aferę Rywina. Nieprawdopodobne, że tacy ludzie robią kariery z ostatniej chwili
Komorowski ostro o Czarzastym: "Był zamieszany w aferę Rywina. Nieprawdopodobne, że tacy ludzie robią kariery"

– Pan Czarzasty jest jedną z trzech osób, trzech polityków, którzy byli bezpośrednio zamieszani w aferę Rywina. To jest rzecz nieprawdopodobna, że tego rodzaju ludzie robią kariery polityczne – stwierdził były prezydent Bronisław Komorowski.

NFZ wydał pilny komunikat z ostatniej chwili
NFZ wydał pilny komunikat

Od 1 lutego 2026 r. dorośli mogą zaszczepić się w aptece przeciw większej liczbie chorób. Katalog wzrósł z 11 do 18, a NFZ pokrywa koszt podania szczepionki na miejscu – informuje w swoim najnowszym komunikacie Narodowy Fundusz Zdrowia.

Czekają nas przedterminowe wybory? Tusk nienawidzi następczyni Hołowni z ostatniej chwili
Czekają nas przedterminowe wybory? "Tusk nienawidzi następczyni Hołowni"

Wybory w Polsce 2050 wygrała Katarzyna Pełczyńska-Nałęcz, mimo że Donald Tusk miał zakulisowo sprzyjać Paulinie Hennig-Klosce. Czy czeka nas upadek rządu i przedterminowe wybory?

Właściciel TVN na sprzedaż. Donald Trump ogłosił decyzję z ostatniej chwili
Właściciel TVN na sprzedaż. Donald Trump ogłosił decyzję

Prezydent USA Donald Trump powiedział w środę, że nie będzie angażował się w walkę między Netflixem a Paramount Skydance o przejęcie koncernu Warner Bros. Discovery. Wcześniej sygnalizował osobiste zaangażowanie w ten proces.

IMGW wydał komunikat. Oto co nas czeka w najbliższych dniach z ostatniej chwili
IMGW wydał komunikat. Oto co nas czeka w najbliższych dniach

Przez Polskę przejdzie ciepły front atmosferyczny, który może spowodować opady deszczu, deszczu ze śniegiem i miejscami marznącego deszczu z gołoledzią – informuje w czwartek rano IMGW.

„ONZ i Zachód promują w Afryce permisywną edukację seksualną jako prawa człowieka” gorące
„ONZ i Zachód promują w Afryce permisywną edukację seksualną jako prawa człowieka”

Jak poinformował portal Hungarian Conservative, ONZ przy wsparciu krajów Zachodu usiłuje wymuszać na Afryce wprowadzanie permisywnej, agresywnej edukacji seksualnej. Dzieje się to pod pozorem praw człowieka.

Obywatele państw UE coraz bardziej zaniepokojeni. Jest najnowszy sondaż Eurobarometru z ostatniej chwili
Obywatele państw UE coraz bardziej zaniepokojeni. Jest najnowszy sondaż Eurobarometru

W czasach wzmożonych napięć geopolitycznych obywatele są coraz bardziej zaniepokojeni swoją przyszłością – wynika z ostatniego badania Eurobarometru, z którego wnioski zostały opublikowane w środę.

Analiza prawna: SAFE - narzędzie wywierania wpływu na państwa członkowskie? gorące
Analiza prawna: SAFE - narzędzie wywierania wpływu na państwa członkowskie?

Rada Unii Europejskiej wydała Rozporządzenie 2025/1106 z dnia 27 maja 2025 r. ustanawiające Instrument na rzecz Zwiększenia Bezpieczeństwa Europy („instrument SAFE”) poprzez Wzmocnienie Europejskiego Przemysłu Obronnego. Celem tego aktu prawnego jest zapewnienie Unii Europejskiej oraz państwom członkowskim większej samodzielności strategicznej i obronności poprzez finansowanie uzupełniania luk i budowy własnych zdolności w zakresie europejskiego przemysłu obronnego. Instytut Ordo Iuris przygotował analizę rozporządzenia dotyczącą ryzyka polityczno-prawnego, związanego z możliwością zastosowania tzw. mechanizmu warunkowości, w odniesieniu do Instrumentu SAFE, czyli powiązania przyznawania środków z przestrzeganiem przez państwa członkowskie zasady praworządności.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane