Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Groźne ogniska ptasiej grypy w Polsce. Wybito dziesiątki tysięcy ptaków z ostatniej chwili
Groźne ogniska ptasiej grypy w Polsce. Wybito dziesiątki tysięcy ptaków

– Ogniska grypy ptaków wykryto w woj. kujawsko-pomorskim w hodowlach 8,5 tys. gęsi w Kołudzie Wielkiej koło Janikowa i 55,6 tys. kur niosek w miejscowości Okrąg koło Lipna – poinformował we wtorek wojewódzki lekarz weterynarii Wojciech Młynarek.

Media: KE informowała o skażonej wołowinie w listopadzie. Teraz ruszają pilne kontrole z ostatniej chwili
Media: KE informowała o skażonej wołowinie w listopadzie. Teraz ruszają "pilne kontrole"

W poniedziałek ministerstwo rolnictwa zapowiedziało pilne kontrole brazylijskiej wołowiny po doniesieniach o wykryciu estradiolu. RMF FM wskazuje, że KE alarmowała już o sprawie w listopadzie.

Doradca prezydenta: SAFE to element pozatraktatowej UNII OBRONNEJ z ostatniej chwili
Doradca prezydenta: SAFE to element pozatraktatowej UNII OBRONNEJ

„SAFE to element pozatraktatowej realizacji UNII OBRONNEJ, przewidzianej w projekcie nowego Traktatu UE, autorstwa Parlamentu Europejskiego, którego byłem jednym z 6 negocjatorów i kontr-sprawozdawcą” - napisał na platformie X doradca prezydenta ds. europejskich dr Jacek Saryusz-Wolski.

Nawet dziś grozi Węgrom. Orban odpowiada Zełenskiemu z ostatniej chwili
"Nawet dziś grozi Węgrom". Orban odpowiada Zełenskiemu

– Węgry od początku wojny opowiadają się za pokojem, jednak nawet dziś, w rocznicę jej wybuchu, prezydent Ukrainy Wołodymyr Zełenski grozi Węgrom, bo nie dajemy się wciągnąć w wojnę, nie wyślemy pieniędzy na Ukrainę i nie zrezygnujemy z niedrogiej rosyjskiej energii – stwierdził premier Viktor Orban.

Prof. Ryszard Piotrowski: SAFE jest niezgodny z Konstytucją i TUE wideo
Prof. Ryszard Piotrowski: SAFE jest niezgodny z Konstytucją i TUE

Prof. Ryszard Piotrowski, konstytucjonalista, wykazał na antenie rozgłośni VOX FM, że program SAFE jest niezgodny m.in. z Konstytucją oraz Traktem o Unii Europejskiej (TUE).

Ostrzeżenie drugiego stopnia przed wezbraniem wody w Widawie. Komunikat dla mieszkańców Wrocławia gorące
Ostrzeżenie drugiego stopnia przed wezbraniem wody w Widawie. Komunikat dla mieszkańców Wrocławia

Instytut Meteorologii i Gospodarki Wodnej (IMGW) wydał ostrzeżenie drugiego stopnia przed wezbraniem wody w Widawie. We wtorek 24 lutego nieznacznie przekroczone zostały stany ostrzegawcze. Publikujemy aktualne odczyty z wodowskazów na Widawie.

TAURON wydał ważny komunikat z ostatniej chwili
TAURON wydał ważny komunikat

TAURON Polska Energia zmieni siedzibę 16 marca 2026 roku. Spółka przenosi biura do budynku w centrum Katowic. Czy nowy adres wpływa na ważność umów? Spółka odpowiada.

„Zamykanie się UE na sprzęt z USA osłabia bezpieczeństwo NATO” z ostatniej chwili
„Zamykanie się UE na sprzęt z USA osłabia bezpieczeństwo NATO”

„Ograniczenie udziału amerykańskiego przemysłu zbrojeniowego w europejskich programach zamówień publicznych zagraża temu partnerstwu i osłabia nasze wzajemne bezpieczeństwo” – napisali na łamach Politico amerykański ambasador przy UE Andrew Puzder i Matthew Whitaker, ambasador USA przy NATO.

Pogrzeb Edwarda Linde-Lubaszenki. Oto jak pożegnał go Olaf Lubaszenko z ostatniej chwili
Pogrzeb Edwarda Linde-Lubaszenki. Oto jak pożegnał go Olaf Lubaszenko

W Warszawie odbył się państwowy pogrzeb Edwarda Linde-Lubaszenki. Aktora pożegnali bliscy, artyści i przedstawiciele władz. Podczas uroczystości poruszające słowa do ojca skierował Olaf Lubaszenko.

Zełenski: Jestem gotowy na spotkanie z Putinem z ostatniej chwili
Zełenski: Jestem gotowy na spotkanie z Putinem

Prezydent Ukrainy Wołodymyr Zełenski powiedział w rozmowie z niemiecką telewizją publiczną ARD, że jest gotowy na spotkanie z Władimirem Putinem. Ocenił, że wojna zakończy się wtedy, gdy USA wraz z krajami Europy "postawią do pionu" rosyjskiego przywódcę.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane