Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Ważny komunikat dla mieszkańców Wrocławia z ostatniej chwili
Ważny komunikat dla mieszkańców Wrocławia

Wrocław zapowiada jedną z najważniejszych inwestycji komunikacyjnych na zachodzie miasta. Węzeł „Kwiska” – dziś mocno obciążony ruchem i mało intuicyjny dla pasażerów – ma przejść metamorfozę porównywaną do tej na Placu Grunwaldzkim. Zmiany obejmą tramwaje, autobusy, rowerzystów i pieszych, a nowy układ przesiadkowy ma stać się jednym z najwygodniejszych w mieście.

Groźny wypadek z udziałem ambulansu. Cztery osoby w szpitalu Wiadomości
Groźny wypadek z udziałem ambulansu. Cztery osoby w szpitalu

Cztery osoby zostały poszkodowane po zderzeniu karetki pogotowia z samochodem osobowym w Ostrowcu Świętokrzyskim. Do wypadku doszło w poniedziałek około godziny 16:00 na skrzyżowaniu ulic Żeromskiego i Zagłoby. Ambulans przewrócił się na bok, a ratownicy oraz pasażerka drugiego pojazdu trafili do szpitala.

Gwiazda Barcelony wraca na boisko Wiadomości
Gwiazda Barcelony wraca na boisko

Niemiecki bramkarz Marc-Andre ter Stegen wrócił do treningów z piłkarską drużyną Barcelony cztery miesiące po operacji kręgosłupa. Według hiszpańskich mediów nie oznacza to jeszcze, że może być brany pod uwagę przez trenera Hansiego Flicka.

Polska była dla Żydów bezpieczną przystanią. Sprawcą Zagłady byli Niemcy tylko u nas
Polska była dla Żydów bezpieczną przystanią. Sprawcą Zagłady byli Niemcy

Oczywiste jest, że Instytut Jad Waszem (i nie tylko on) powinien wyraźnie podkreślać - zawsze i wszędzie - że to Niemcy na terenie okupowanej Polski wprowadzali rasistowskie, niemieckie prawo, jednocześnie dokonując ludobójstwa w imieniu państwa niemieckiego.

Fiasko spotkania Nawrocki-Orban. Zbigniew Bogucki tłumaczy z ostatniej chwili
Fiasko spotkania Nawrocki-Orban. Zbigniew Bogucki tłumaczy

W rozmowie z Polsat News szef Kancelarii Prezydenta RP Zbigniew Bogucki wytłumaczył powody odwołania spotkania Karola Nawrockiego z premierem Węgier Viktorem Orbanem.

Kryzys w niemieckich szkołach. Nauczyciele biją na alarm z ostatniej chwili
Kryzys w niemieckich szkołach. Nauczyciele biją na alarm

W Hesji narasta niepokój wśród nauczycieli szkół podstawowych. Prawie 1100 z nich podpisało obszerną rezolucję, w której opisują pogarszające się umiejętności uczniów oraz trudne warunki pracy. Dokument trafił już do heskiego ministerstwa edukacji.

Piłkarz Ekstraklasy aresztowany w związku z zarzutem gwałtu z ostatniej chwili
Piłkarz Ekstraklasy aresztowany w związku z zarzutem gwałtu

Piłkarz Radomiaka Ibrahima C. został w poniedziałek aresztowany na trzy miesiące w związku z przedstawionym mu zarzutem zgwałcenia mieszkanki Radomia – potwierdziła PAP rzeczniczka Prokuratury Okręgowej w Radomiu Aneta Góźdź.

Warszawiacy zaniepokojeni kolorem potoku. Służby wyjaśniają Wiadomości
Warszawiacy zaniepokojeni kolorem potoku. Służby wyjaśniają

Jaskrawozielona woda, którą od wczoraj można było zauważyć w Potoku Służewieckim, ponownie zaniepokoiła mieszkańców Służewa. Nietypowe zabarwienie było widoczne najpierw wzdłuż Doliny Służewieckiej, przy ulicy Puławskiej, a dziś najbardziej rzucało się w oczy dopiero poniżej bobrzej tamy przy ulicy Anody.

Ta ustawa tworzy realne zagrożenia. Nowe weto prezydenta Nawrockiego z ostatniej chwili
"Ta ustawa tworzy realne zagrożenia". Nowe weto prezydenta Nawrockiego

Rzecznik prezydenta RP Rafał Leśkiewicz poinformował na platformie X, że Karol Nawrocki podjął decyzję o zawetowaniu ustawy o rynku kryptoaktywów. "Prezydent Karol Nawrocki korzysta z konstytucyjnej prerogatywy weta tylko wtedy, kiedy przepisy zagrażają wolnościom Polaków, ich majątkowi i stabilności państwa. A ta ustawa takie realne zagrożenia tworzy" – podkreślił Leśkiewicz.

Burza po występie Kultu. Kazik wyjaśnia i ogłasza trudną decyzję z ostatniej chwili
Burza po występie Kultu. Kazik wyjaśnia i ogłasza trudną decyzję

Podczas koncertu Kultu w Zielonej Górze widzowie zwrócili uwagę, że lider grupy wygląda na bardzo zmęczonego i ich zdaniem występ powinien zostać przerwany. Nagrania i relacje szybko trafiły do sieci i wywołały dyskusję.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane