Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Ceny pelletu w Polsce i w Niemczech. Gdzie jest taniej? z ostatniej chwili
Ceny pelletu w Polsce i w Niemczech. Gdzie jest taniej?

Ceny pelletu w Polsce i Niemczech mocno wzrosły w sezonie grzewczym 2026. Na pierwszy rzut oka stawki po obu stronach granicy wydają się podobne, ale w praktyce różnice mogą być bardzo duże.

„Claret” – poruszający film o wierze w czasach prześladowań. Recenzja z ostatniej chwili
„Claret” – poruszający film o wierze w czasach prześladowań. Recenzja

Film "Claret" (znany również jako "Slaves and Kings") z 2021 roku w reżyserii Pablo Moreno to wręcz hagiograficzna biografia św. Antoniego Marii Clareta, założyciela Zgromadzenia Misjonarzy Synów Niepokalanego Serca Maryi, powszechnie zwanych klaretynami. Hiszpańska produkcja nie tylko oddaje hołd jednemu z największych misjonarzy XIX wieku, ale także przypomina o sile wiary w obliczu prześladowań. Jako miłośnik filmów historycznych i religijnych, gorąco polecam ten obraz każdemu, kto szuka inspiracji i głębszego zrozumienia walki Kościoła w burzliwej historii Hiszpanii. To nie jest tylko biografia – to lekcja odwagi i oddania, która współgra z dzisiejszymi wyzwaniami. 

Trump ostrzega świat: Uwaga kupujący!!! z ostatniej chwili
Trump ostrzega świat: "Uwaga kupujący!!!"

Sąd Najwyższy USA podważył podstawę prawną większości ceł Donalda Trumpa. Prezydent odpowiedział ostrym wpisem.

Nowy rozdział relacji strategicznych Polski z Norwegią. Współpraca bez jakichkolwiek rys z ostatniej chwili
Nowy rozdział relacji strategicznych Polski z Norwegią. "Współpraca bez jakichkolwiek rys"

Przechodzimy do intensywnych prac nad sformalizowaniem i ustrukturyzowaniem polsko-norweskich relacji strategicznych - oświadczył premier Norwegii Jonas Gahr Store po spotkaniu z premierem Donaldem Tuskiem w podkarpackiej Lipie. Polska i Norwegia współpracują bez jakichkolwiek rys - stwierdził.

Atak nożownika w Niemczech. Ruszył na ludzi przy stoisku z ostatniej chwili
Atak nożownika w Niemczech. Ruszył na ludzi przy stoisku

Atak z nożem na dworcu głównym w niemieckim Würzburgu. 35-letni Afgańczyk zaatakował trzech przedstawicieli Świadków Jehowy.

Daniel Obajtek: Przy takiej polityce za dwa–trzy lata Lasy Państwowe będą bankrutem z ostatniej chwili
Daniel Obajtek: Przy takiej polityce za dwa–trzy lata Lasy Państwowe będą bankrutem

– Przy takiej polityce za dwa–trzy lata Lasy Państwowe będą bankrutem – alarmował eurodeputowany Daniel Obajtek podczas poniedziałkowej konferencji Prawa i Sprawiedliwości w Sejmie RP. 

Znany dziennikarz odszedł z TVN. Przyznaję się... z ostatniej chwili
Znany dziennikarz odszedł z TVN. "Przyznaję się..."

Po wielu latach Michał Kempa odchodzi z TVN. Komik i dziennikarz pożegnał się z "Szkłem kontaktowym" w długim wpisie opublikowanym w sieci.

„Rzeczpospolita” ujawnia informacje nt. stanu zdrowia Szymona Hołowni. Jest oświadczenie byłego marszałka z ostatniej chwili
„Rzeczpospolita” ujawnia informacje nt. stanu zdrowia Szymona Hołowni. Jest oświadczenie byłego marszałka

„Redaktor Nizinkiewicz postanowił, bez mojej wiedzy, zgody, bez rozmowy ze mną, przemocowo mnie «wyoutować» i ujawnić publicznie, na co choruję, na podstawie plotek, o których usłyszał na mieście od mojego «otoczenia»” – pisze na platformie X wicemarszałek Sejmu Szymon Hołownia, odpowiadając na artykuł „Rzeczpospolitej”.

Jest zawiadomienie do CBA ws. programu SAFE z ostatniej chwili
Jest zawiadomienie do CBA ws. programu SAFE

Politycy PiS złożyli do CBA zawiadomienie ws. programu SAFE. – Związki personalne i decyzje podejmowane w KPRM sugerują, że może dojść do nieprawidłowości – podkreślił europoseł Jacek Ozdoba.

Czarzasty w Kijowie: „Pomożemy wam w wejściu do UE” z ostatniej chwili
Czarzasty w Kijowie: „Pomożemy wam w wejściu do UE”

Polski Sejm będzie wspierał Ukrainę w drodze do Unii Europejskiej – taką deklarację podpisał w poniedziałek w Kijowie marszałek Sejmu Włodzimierz Czarzasty. Przewodniczący Rady Najwyższej Rusłan Stefanczuk podziękował za wsparcie, jakie od początku wojny płynie z Polski. Podpisał też deklarację „w imieniu całej demokratycznej Europy”.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane