Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Stan wyjątkowy w Nowym Jorku. Nadciąga potężna śnieżyca Wiadomości
Stan wyjątkowy w Nowym Jorku. Nadciąga potężna śnieżyca

Burmistrz Nowego Jorku Zohran Mamdani ogłosił w niedzielę stan wyjątkowy w mieście z powodu prognozowanej niezwykle silnej śnieżycy. Wprowadził zakaz przemieszczania się oraz zdecydował o zamknięciu w poniedziałek szkół publicznych. Władze ostrzegają przed zagrożeniem życia i całkowitym paraliżem komunikacyjnym.

GIS wydał ostrzeżenie. Na ten produkt trzeba uważać Wiadomości
GIS wydał ostrzeżenie. Na ten produkt trzeba uważać

Z półek sklepów sieci ALDI znika popularny makaron. Decyzja o wycofaniu zapadła po tym, jak wykryto błąd w oznakowaniu - na etykiecie nie wyróżniono obecności pszenicy, czyli alergenu zawierającego gluten. O sprawie poinformował Główny Inspektorat Sanitarny.

Gratka dla miłośników astronomii. Nie przegap tego zjawiska Wiadomości
Gratka dla miłośników astronomii. Nie przegap tego zjawiska

28 lutego na wieczornym niebie będzie można zobaczyć tzw. paradę planet. To zjawisko polega na tym, że kilka planet – z perspektywy Ziemi – wydaje się ustawiać w jednej linii. Choć w rzeczywistości dzielą je ogromne odległości, na niebie pojawiają się w tym samym czasie wzdłuż jednej linii zwanej ekliptyką.

Awaria na kolei w Opolu: pociągi kursują z opóźnieniami Wiadomości
Awaria na kolei w Opolu: pociągi kursują z opóźnieniami

Na trasie Opole - Suchy Bór doszło do wykolejenia lokomotywy elektrycznej. Nikt nie został ranny. Na miejscu pracują strażacy i policja. Utrudnienia w ruchu dotyczą pociągów jadących trasą Tarnowskie Góry - Opole Główne.

Burza po niedzielnej „Familiadzie”. Widzowie podzieleni Wiadomości
Burza po niedzielnej „Familiadzie”. Widzowie podzieleni

Ostatni odcinek kultowego teleturnieju „Familiada” wywołał kolejną falę komentarzy w internecie. W studiu rywalizowały drużyny „Aniołki Weroniki” i „Kwartet Podatkowy”, a emocje wywołała szczególnie odpowiedź na pytanie o białego, rasowego psa. Ostatecznie zabrakło 28 punktów do wygranej, a najwyżej punktowaną odpowiedzią, jak podano na profilu programu, był maltańczyk.

Zima na finiszu? W najbliższych dniach temperatury pójdą w górę z ostatniej chwili
Zima na finiszu? W najbliższych dniach temperatury pójdą w górę

Najbliższe dni przyniosą wyraźne ocieplenie i odejście od zimowej aury. Jak zapowiada znany synoptyk, czeka nas zupełnie nowy trend pogodowy, a mróz stanie się jedynie epizodem.

Walka o kolejne medale. Wiadomo, co dalej z Kacprem Tomasiakiem z ostatniej chwili
Walka o kolejne medale. Wiadomo, co dalej z Kacprem Tomasiakiem

Polski Związek Narciarski ogłosił skład na mistrzostwa świata juniorów w skokach. W kadrze znalazł się Kacper Tomasiak, który po historycznych igrzyskach stanie przed kolejną szansą na medal.

Nie żyje wybitny polski sportowiec. Olbrzym z Rzeszowa miał 73 lata z ostatniej chwili
Nie żyje wybitny polski sportowiec. "Olbrzym z Rzeszowa" miał 73 lata

W sobotę w wieku 73 lat zmarł w Witten w Niemczech Adam Sandurski, jeden z najwybitniejszych polskich zapaśników w stylu wolnym, medalista olimpijski z Moskwy - poinformowała PAP rodzina sportowca. Mierzący 214 cm zawodnik stawał też na podium mistrzostw Polski, świata i Europy.

Poważna awaria na północy Norwegii. Nie działają telefony i terminale Wiadomości
Poważna awaria na północy Norwegii. Nie działają telefony i terminale

W regionie Finnmark w Norwegii, graniczącym z Rosją, doszło do poważnej awarii sieci komórkowej i internetu wywołana została uszkodzeniem podmorskiego kabla światłowodowego.

Więzień nr 6535. Tajemnica obozowego zdjęcia tylko u nas
Więzień nr 6535. Tajemnica obozowego zdjęcia

Przez dziesięciolecia był tylko numerem – 6535. Anonimowy więzień z obozowego zdjęcia w archiwum Muzeum Auschwitz-Birkenau okazał się bratem legendarnego kuriera Jana Karskiego. Odkrycie rzuca nowe światło na dramatyczne losy Mariana Kozielewskiego – oficera, konspiratora i więźnia Auschwitz.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane