Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Karol Nawrocki przybył do Wielkiej Brytanii. Spotka się m.in z premierem Keirem Starmerem z ostatniej chwili
Karol Nawrocki przybył do Wielkiej Brytanii. Spotka się m.in z premierem Keirem Starmerem

Prezydent Karol Nawrocki w poniedziałek przybył z wizytą roboczą do Wielkiej Brytanii, gdzie we wtorek po południu w Londynie spotka się z premierem Keirem Starmerem. Głównym tematem rozmów liderów będzie bezpieczeństwo i współpraca gospodarcza.

W Polsce 2050 wrze. Kobosko miał zostać oskarżony przez Hołownię o zdradę z ostatniej chwili
W Polsce 2050 wrze. Kobosko miał zostać oskarżony przez Hołownię o zdradę

Napięcia w Polsce 2050 osiągnęły punkt krytyczny. Według "Gazety Wyborczej", w trakcie zamkniętego spotkania partyjnego Szymon Hołownia miał oskarżyć europosła Michał Kobosko o zdradę. Wszystko z powodu jego niedawnego spotkania z premierem Donaldem Tuskiem.

Zasadnicze pytanie do ministra Sikorskiego: czy Pan wie co Pan robi? tylko u nas
Zasadnicze pytanie do ministra Sikorskiego: czy Pan wie co Pan robi?

Wypowiedzi ministra spraw zagranicznych Radosława Sikorskiego dotyczące stanowiska USA wobec Grenlandii wywołały dyskusję na temat roli Polski w debacie o bezpieczeństwie Arktyki. Sprawa dotyczy relacji transatlantyckich, znaczenia Grenlandii dla NATO oraz szerszej rywalizacji geopolitycznej w regionie.

Jarosław Kaczyński: Przed wyborami trzeba zjednoczyć obóz patriotyczny z ostatniej chwili
Jarosław Kaczyński: Przed wyborami trzeba zjednoczyć obóz patriotyczny

Trzeba zjednoczyć obóz patriotyczny, który powinien dzisiaj w Polsce wygrać wybory bez specjalnego trudu - ocenił prezes PiS Jarosław Kaczyński na spotkaniu w mieszkańcami w Węgrowie. Dodał, że na wybory parlamentarne w 2027 r. PiS musi przygotować program dla całej patriotycznej Polski.

#CoPoTusku. Mamy dwa lata na odzyskanie cyfrowej niepodległości tylko u nas
#CoPoTusku. Mamy dwa lata na odzyskanie cyfrowej niepodległości

Jakiś czas temu siedziałem na spotkaniu z zespołem programistów omawiając postępy prac w projekcie. W pewnym momencie zapytałem: "Jak zamierzacie wdrożyć środowisko developerskie?"

Polacy coraz bardziej sceptyczni wobec imigracji. Badanie nie pozostawia wątpliwości z ostatniej chwili
Polacy coraz bardziej sceptyczni wobec imigracji. Badanie nie pozostawia wątpliwości

Zdecydowana większość Polaków opowiada się za zmniejszeniem liczby imigrantów przyjmowanych spoza Unii Europejskiej. Takie wnioski płyną z najnowszego badania United Surveys by IBRiS dla Wirtualnej Polski.

To nieakceptowalne. Żurek wściekły po decyzji węgierskiego rządu z ostatniej chwili
"To nieakceptowalne". Żurek wściekły po decyzji węgierskiego rządu

Minister sprawiedliwości, Prokurator Generalny Waldemar Żurek ocenił, że postawa Węgier ws. b. szefa MS Zbigniewa Ziobry jest "nieakceptowalna".

Süddeutsche Zeitung: „Na uratowanie UE zostało niespełna dwa lata” z ostatniej chwili
Süddeutsche Zeitung: „Na uratowanie UE zostało niespełna dwa lata”

Unia Europejska może nie przetrwać w obecnym kształcie – ostrzega niemiecki dziennik Süddeutsche Zeitung. Według autora felietonu red. Josefa Kelnbergera kluczowe będą najbliższe dwa lata, a szczególnie wybory we Francji i w Polsce w 2027 roku. Jeśli wygra w nich prawica, liberalny projekt UE może się rozpaść.

Belgijscy rolnicy nie ustają w protestach przeciw Mercosur. Blokady na lotnisku w Ostendzie z ostatniej chwili
Belgijscy rolnicy nie ustają w protestach przeciw Mercosur. Blokady na lotnisku w Ostendzie

Belgijscy rolnicy od poniedziałku rano protestują na lotnisku w Ostendzie przeciwko umowie handlowej UE z blokiem Mercosur. Około 60 traktorów stoi przed budynkiem portu. Rolnicy blokują wjazd oraz wyjazd ciężarówek na lotnisko, z którego transportowane jest cargo - podała agencja Belga.

Polska jako champion wzrostu. Prestiżowy dziennik z Hongkongu o nowym kierunku ekspansji z ostatniej chwili
Polska jako champion wzrostu. Prestiżowy dziennik z Hongkongu o nowym kierunku ekspansji

Polska należy dziś do najszybciej rozwijających się gospodarek świata, puka do bram G20 i coraz śmielej patrzy poza Europę. Jak opisuje w okładkowej publikacji „The Standard” – największy anglojęzyczny dziennik w Hongkongu – kluczową rolę w tej strategii może odegrać Hongkong jako brama do Azji i Chin dla polskich przedsiębiorstw.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane