Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Włochy wstrząśnięte. Śmierć 2-latka po transplantacji uszkodzonego serca Wiadomości
Włochy wstrząśnięte. Śmierć 2-latka po transplantacji uszkodzonego serca

W szpitalu w Neapolu zmarł w sobotę dwuletni chłopiec, któremu w grudniu przeszczepiono uszkodzone w transporcie serce - podały włoskie media. Sprawa wstrząsnęła opinią publiczną we Włoszech.

Ważny komunikat dla mieszkańców Torunia gorące
Ważny komunikat dla mieszkańców Torunia

Informacja Toruńskiego Centrum Zarządzania Kryzysowego (TCZK). W związku z możliwością wystąpienia marznących opadów przewiduje się śliskość na drogach i oblodzonych chodnikach oraz utrudnienia komunikacyjne.

5-latka wypadła z wysokiego piętra. Ojciec był pijany Wiadomości
5-latka wypadła z wysokiego piętra. Ojciec był pijany

Do dramatycznego wypadku doszło w sobotę, 21 lutego, w miejscowości Olszyna koło Lubań na Dolnym Śląsku. Z mieszkania na wysokim piętrze wypadła pięcioletnia dziewczynka. Dziecko przeżyło upadek i trafiło do szpitala.

Nowe cła Trumpa jednak wyższe. Globalna stawka rośnie Wiadomości
Nowe cła Trumpa jednak wyższe. Globalna stawka rośnie

Prezydent USA Donald Trump zapowiedział w sobotę, że podniesie z 10 do 15 proc. tymczasową globalną stawkę celną na towary importowane, po tym, jak Sąd Najwyższy Stanów Zjednoczonych unieważnił większość taryf nałożonych przez Trumpa w 2025 r.

Nowa prognoza pogody. IMGW wydał komunikat na najbliższe dni Wiadomości
Nowa prognoza pogody. IMGW wydał komunikat na najbliższe dni

Jak informuje Instytut Meteorologii i Gospodarki Wodnej, nad północną Europą będą dominowały niże: niż atlantycki z ośrodkami położonymi na północ i północny wschód od Wysp Brytyjskich oraz niż z ośrodkiem nad Zatoką Fińską. Również w południowo wschodniej Europie pogodę będzie kształtował niż z ośrodkiem nad Morzem Czarnym. Pozostałe obszary kontynentu będą pod wpływem wyżów.

Dramat w warszawskim metrze. Nietrzeźwy mężczyzna wpadł na torowisko Wiadomości
Dramat w warszawskim metrze. Nietrzeźwy mężczyzna wpadł na torowisko

W sobotę, 21 lutego, w warszawskim metrze doszło do poważnego incydentu. Nietrzeźwy mężczyzna znalazł się na torach stacji Dworzec Wileński w chwili, gdy wjeżdżał pociąg. Na szczęście funkcjonariusze szybko zareagowali i udzielili mu pomocy - mężczyzna nie odniósł poważnych obrażeń i został przewieziony na izbę wytrzeźwień.

Co dalej z Lewandowskim? Hiszpański dziennikarz zabrał głos Wiadomości
Co dalej z Lewandowskim? Hiszpański dziennikarz zabrał głos

Robert Lewandowski nie jest już podstawowym zawodnikiem w każdym meczu FC Barcelona. 37-letni napastnik często wchodzi z ławki i gra po 25–30 minut. W tym sezonie strzelił 10 goli w lidze i dwa w Lidze Mistrzów.

Fico ostro do Zełenskiego: Zaprzestaniemy dostaw energii z ostatniej chwili
Fico ostro do Zełenskiego: Zaprzestaniemy dostaw energii

„JEŻELI PREZYDENT UKRAINY NIE WZNOWI W PONIEDZIAŁEK DOSTAW ROPY NAFTOWEJ NA SŁOWACJĘ, TEGO SAMEGO DNIA POPROSZĘ ODPOWIEDNIE SŁOWACKIE FIRMY O ZAPRZESTANIE AWARYJNYCH DOSTAW ENERGII ELEKTRYCZNEJ NA UKRAINĘ” - napisał na platformie X Robert Fico.

Tragiczny finał poszukiwań w Tatrach. Znaleziono ciało turysty Wiadomości
Tragiczny finał poszukiwań w Tatrach. Znaleziono ciało turysty

W Tatrach w sobotę zagrożenie lawinowe spadło do drugiego, umiarkowanego stopnia – poinformowało TOPR. Ratownicy podkreślają, że warunki w wyższych partiach gór pozostają wymagające, a głównym problemem są depozyty przewianego śniegu.

Syria nie chce z powrotem swoich obywateli. „Są niebezpieczni” z ostatniej chwili
Syria nie chce z powrotem swoich obywateli. „Są niebezpieczni”

Syria prosi Niemcy, aby nie deportowały swoich obywateli z powrotem do kraju, ostrzegając, że uczyniłoby to kraj „niebezpiecznym” - poinformował portal rmx.news.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane