Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Wybory przewodniczącego Polski 2050. Jest decyzja Rady Krajowej z ostatniej chwili
Wybory przewodniczącego Polski 2050. Jest decyzja Rady Krajowej

Z komunikatu prasowego wydanego przez biuro prasowe Polski 2050 wynika, że II tura wyborów na szefa partii odbędzie się do 31 stycznia.

Zbigniew Ziobro: Żurek przez przypadek powiedział trochę prawdy z ostatniej chwili
Zbigniew Ziobro: Żurek przez przypadek powiedział trochę prawdy

Na skutek kontrowersyjnego postanowienia sądu w Giżycku, w przestrzeni publicznej znów wybuchł spór o status tzw. neosędziów. Obszerny wpis na ten temat opublikował minister sprawiedliwości Waldemar Żurek; doczekał się on ostrej reakcji byłego szefa resortu sprawiedliwości Zbigniewa Ziobry, który zarzucił Żurkowi hipokryzję i współodpowiedzialność za chaos w sądach.

Prezydent Nawrocki już w Davos. Wystąpienie o Trójmorzu i sesja z Donaldem Trumpem na agendzie z ostatniej chwili
Prezydent Nawrocki już w Davos. Wystąpienie o Trójmorzu i sesja z Donaldem Trumpem na agendzie

W poniedziałek wieczorem prezydent Karol Nawrocki przybył do Szwajcarii, gdzie od wtorku weźmie udział w Światowym Forum Ekonomicznym w Davos. Program wizyty obejmuje m.in. sesję z prezydentem USA Donaldem Trumpem, spotkanie z prezesem Banku Światowego, a także wystąpienie poświęcone Inicjatywie Trójmorza.

Trump doprowadza europejskich biurokratów do furii tylko u nas
Trump doprowadza europejskich biurokratów do furii

Już za chwilę będzie czwarta rocznica ataku Rosji na Ukrainę, a Europa jest bezradna wobec wojny na własnym kontynencie. Cała nadzieja wciąż w Trumpie, mimo że jest jaki jest.

Awaria ciepłownicza. Ważny komunikat dla mieszkańców Krakowa z ostatniej chwili
Awaria ciepłownicza. Ważny komunikat dla mieszkańców Krakowa

Mieszkańcy części Krakowa muszą liczyć się z nocną przerwą w ogrzewaniu. Jak poinformowało MPEC Kraków, doszło do awarii sieci ciepłowniczej w rejonie Podgórza. W części budynków ciepło już wróciło, jednak w pozostałych lokalizacjach naprawa potrwa do późnych godzin nocnych.

Tusk odgraża się ws. zaproszenia Karola Nawrockiego do Rady Pokoju. „Nikomu nie damy się rozegrać” z ostatniej chwili
Tusk odgraża się ws. zaproszenia Karola Nawrockiego do Rady Pokoju. „Nikomu nie damy się rozegrać”

Przystąpienie Polski do organizacji międzynarodowej wymaga zgody Rady Ministrów i ratyfikacji przez Sejm; rząd będzie kierować się wyłącznie interesem państwa polskiego i nikomu nie damy się rozegrać - oświadczył w poniedziałek premier Donald Tusk we wpisie na platformie X.

Jest decyzja Karola Nawrockiego ws. budżetu z ostatniej chwili
Jest decyzja Karola Nawrockiego ws. budżetu

Prezydent Karol Nawrocki podpisał ustawę budżetową na 2026 r. – poinformowała w poniedziałek na X kancelaria prezydenta. Jednocześnie prezydent zdecydował o skierowaniu ustawy do Trybunału Konstytucyjnego.

Czy USA zdecydują się na wojskową interwencję na Grenlandii? Jest odpowiedź Donalda Trumpa z ostatniej chwili
Czy USA zdecydują się na wojskową interwencję na Grenlandii? Jest odpowiedź Donalda Trumpa

Prezydent USA Donald Trump odmówił w poniedziałek odpowiedzi na pytanie, czy może użyć siły do zajęcia Grenlandii. Zapowiedział jednak, że „na 100 procent” nałoży cła na państwa europejskie, które wysłały wojska na wyspę i polecił Europie, by skupiła się na Ukrainie, a nie Grenlandii.

Rolnicy z całej UE jadą do Strasburga z ostatniej chwili
Rolnicy z całej UE jadą do Strasburga

We wtorek przed Parlamentem Europejskim w Strasburgu odbędzie się wielka demonstracja rolników, w której zapowiedziano udział ponad 5000 osób i 1000 traktorów. Farmerzy chcą przekonać europosłów, żeby odrzucili umowę handlową z krajami Mercosuru.

Polacy zdecydowanie przeciwni mieszaniu się do grenlandzkiej awantury. Jest sondaż z ostatniej chwili
Polacy zdecydowanie przeciwni mieszaniu się do grenlandzkiej awantury. Jest sondaż

Ponad połowa Polaków sprzeciwia się wysłaniu nawet symbolicznej liczby żołnierzy na Grenlandię. Najnowszy sondaż IBRiS pokazuje wyraźny sceptycyzm społeczeństwa wobec angażowania się Polski w spór wokół wyspy.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane