Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
FIFA odsłania karty. Oto możliwi przeciwnicy biało-czerwonych z ostatniej chwili
FIFA odsłania karty. Oto możliwi przeciwnicy biało-czerwonych

Piłkarska reprezentacja Polski, w przypadku awansu z baraży do mistrzostw świata, rozegra pierwszy mecz mundialu 15 czerwca z Tunezją w Guadalupe/Monterrey w Meksyku. Pięć dni później czeka w Houston Holandia, a 26 czerwca w Arlington/Dallas - Japonia.

Znana polska piosenkarka w żałobie. Przekazała smutne wieści Wiadomości
Znana polska piosenkarka w żałobie. Przekazała smutne wieści

Małgorzata Ostrowska poinformowała o śmierci swojego męża, Jacka Gulczyńskiego. Artystka przekazała tę wiadomość w poruszającym wpisie na Instagramie. Kilka dni wcześniej opowiadała, że jej małżonek przebywa w poznańskim Hospicjum Palium.

Sezon grzewczy znowu zbiera żniwo. Strażacy apelują Wiadomości
Sezon grzewczy znowu zbiera żniwo. Strażacy apelują

Od 1 października do 5 grudnia strażacy odnotowali ponad 5 tys. pożarów w budynkach mieszkalnych, w wyniku których zmarły 82 osoby - przekazał w sobotę rzecznik prasowy komendanta głównego PSP st. bryg. Karol Kierzkowski. Strażacy apelują o stosowanie czujek dymu i czadu w domach.

Nowa strategia USA to przełom. Polska przed geopolitycznym testem tylko u nas
Nowa strategia USA to przełom. Polska przed geopolitycznym testem

Nowa strategia bezpieczeństwa USA to geopolityczny wstrząs, który zmienia układ sił na świecie. Waszyngton przenosi uwagę z Europy na Azję, a Polska dostaje wyraźny sygnał: możemy być ważnym elementem geopolitycznej układanki, ale czas samodzielnie zadbać o własne bezpieczeństwo.

Chaos na lotnisku w Wilnie. Rząd szykuje stan wyjątkowy Wiadomości
Chaos na lotnisku w Wilnie. Rząd szykuje stan wyjątkowy

Władze lotniska w Wilnie poinformowały w sobotę po południu o tymczasowym wstrzymaniu ruchu samolotów po wykryciu balonów przemytniczych nadlatujących z Białorusi. To kolejny taki incydent w ostatnich tygodniach.

Świąteczne zakupy w sieci. Policja radzi, na co uważać Wiadomości
Świąteczne zakupy w sieci. Policja radzi, na co uważać

Wraz z początkiem grudnia Polacy ruszyli na poszukiwania prezentów. Coraz więcej tych zakupów odbywa się w internecie, dlatego policja przypomina o podstawowych zasadach bezpieczeństwa. Wystarczy chwila nieuwagi, a możemy stracić pieniądze.

Nalot ABW na Profeto. Mec. Wąsowski: Mój mandant dostał zawału serca z ostatniej chwili
Nalot ABW na Profeto. Mec. Wąsowski: Mój mandant dostał zawału serca

Chodzi o pana Dariusza, dostawcę sprzętu do Fundacji Profeto, wobec którego ABW podjęło czynności bez udziału adwokata. W trakcie tych czynności pan Dariusz doznał zawału serca.

Wymagający konkurs w Wiśle. Jeden z biało-czerwonych uratował honor Wiadomości
Wymagający konkurs w Wiśle. Jeden z biało-czerwonych uratował honor

Sobotni konkurs Pucharu Świata w Wiśle ponownie okazał się trudny dla reprezentacji Polski. Po piątkowych kwalifikacjach, w których odpadło aż pięciu naszych zawodników, w konkursie wystartowało tylko pięciu biało-czerwonych. Najlepszym z nich był Piotr Żyła, który zajął 14. miejsce - to jego najlepszy wynik w tym sezonie.

Leżałam na ziemi i płakałam. Szczere wyznanie uczestniczki TzG Wiadomości
"Leżałam na ziemi i płakałam". Szczere wyznanie uczestniczki "TzG"

Decyzja Agnieszki Kaczorowskiej o odejściu z „Tańca z gwiazdami” wywołała szerokie poruszenie wśród fanów programu. Choć informację przekazała w emocjonalnym wpisie na Instagramie, dopiero teraz opowiedziała, co naprawdę działo się w ostatnich miesiącach.

Mgła i mżawka przez cały weekend. IMGW ostrzega Wiadomości
Mgła i mżawka przez cały weekend. IMGW ostrzega

Przez weekend będzie pochmurnie, ze słabymi opadami deszczu lub mżawki, cały czas będą utrzymywać się mgły - poinformował PAP synoptyk Instytutu Meteorologii i Gospodarki Wodnej Michał Kowalczuk.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane