Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Prof. Czarnek: Jeżeli Tusk będzie chciał obejść weto prezydenta ws. SAFE uchwałą, stanie przed sądem z ostatniej chwili
Prof. Czarnek: Jeżeli Tusk będzie chciał obejść weto prezydenta ws. SAFE uchwałą, stanie przed sądem

„Herr Kamerad Czarzasty, Herr OberTusk i popychadła Tuska z Koalicji 13 grudnia chcą zrobić Polsce wielką krzywdę, i jeśli będą ją robili, to za nią odpowiedzą” - zapowiedział podczas środowej konferencji prasowej w Sejmie prof. Przemysław Czarnek, kandydat PiS na premiera.

Ważny komunikat dla mieszkańców Szczecina gorące
Ważny komunikat dla mieszkańców Szczecina

Mieszkańcy Szczecina powinni zachować ostrożność. Służby ostrzegają przed ryzykiem przekroczenia poziomu informowania dla pyłu PM10 w powietrzu. Zanieczyszczenie może być szczególnie niebezpieczne dla dzieci, seniorów oraz osób z chorobami układu oddechowego i serca.

Zełenski wzywa Europę, aby opracowała „Plan B“ finansowania Ukrainy z ostatniej chwili
Zełenski wzywa Europę, aby opracowała „Plan B“ finansowania Ukrainy

W obliczu blokady przez Węgry obiecanej pożyczki w wysokości 90 miliardów euro prezydent Ukrainy Wołodymyr Zełenski wzywa Europę do znalezienia alternatywnego rozwiązania.

Ursula von der Leyen: Potrzebujemy ETS z ostatniej chwili
Ursula von der Leyen: Potrzebujemy ETS

„Potrzebujemy więc ETS, ale musimy go zmodernizować. Z niecierpliwością czekam na kontynuację tej debaty z Państwem tutaj, w Parlamencie Europejskim” - powiedziała przewodnicząca Komisji Europejskiej Ursula von der Leyen podczas sesji plenarnej w Parlamencie Europejskim.

SAFE. Z ziemi tuskiej do Polski tylko u nas
SAFE. Z ziemi tuskiej do Polski

Nie ustaje spór o SAFE. Czy ten unijny, czy ten prezydencki. Argumentów padło wiele, ale wymowne jest to, że nikt nie jest w stanie podać konkretnej wysokości należnych odsetek. Dlaczego? Bo to niemożliwe.

Zamach PE na suwerenność państw UE. „Autonomia Europy zaczyna się od jednolitego rynku obronnego” z ostatniej chwili
Zamach PE na suwerenność państw UE. „Autonomia Europy zaczyna się od jednolitego rynku obronnego”

Posłowie do Parlamentu Europejskiego przyjęli propozycje mające na celu utworzenie wspólnego rynku obronnego i podjęcie działań w sprawie sztandarowych projektów obronnych Unii Europejskiej.

Młodzi muzułmanie w Niemczech się radykalizują z ostatniej chwili
Młodzi muzułmanie w Niemczech się radykalizują

Jak poinformował portal European Conservative, obawy dotyczące radykalizacji wśród muzułmanów w Niemczech — szczególnie wśród młodszego pokolenia — wzrosły po opublikowaniu badań finansowanych przez trzy ministerstwa federalne.

Ekspert: Pierwsza wypłata zysków NBP przeznaczonych na zbrojenia mogłaby nastąpić dopiero za 1,5 roku z ostatniej chwili
Ekspert: Pierwsza wypłata zysków NBP przeznaczonych na zbrojenia mogłaby nastąpić dopiero za 1,5 roku

Pomysł sfinansowania zbrojeń z zysków NBP uzyskanych ze sprzedaży części złota oznaczałby, że pierwsze wpływy nastąpiłyby za półtora roku, tymczasem potrzeby wojska trzeba zaspokoić jak najszybciej – wskazał w rozmowie z PAP analityk Santander Bank Polska Piotr Bielski.

Wraz z wetem prezydenta ws. SAFE posypie się plan KE rabunku i neutralizacji Polski tylko u nas
Wraz z wetem prezydenta ws. SAFE posypie się plan KE rabunku i neutralizacji Polski

Komisja Europejska nieoficjalnie wyraża „poważne zaniepokojenie” sytuacją wokół polskiego programu SAFE. Chodzi o spór między rządem a Pałacem Prezydenckim, który według informacji z Brukseli wprowadza „niepewność co do realizacji projektu”. Niepokój Ursuli von der Leyen jest o tyle zrozumiały, że wraz z zawetowaniem przez Karola Nawrockiego ustawy ws. SAFE, o ile takie by nastąpiło, posypie się misterny plan rabunku i neutralizacji Polski.

Raport: Niemcy nie nadążają deportować migrantów tylko u nas
Raport: Niemcy nie nadążają deportować migrantów

W Niemczech rośnie liczba migrantów zobowiązanych do opuszczenia kraju. Z rządowego raportu wynika, że w połowie 2025 roku było ich ponad 226 tys., a skuteczność deportacji wynosi zaledwie ok. 5 proc. Problem pogłębia brak dokumentów, bariery prawne i niewydolność systemu dublińskiego.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane