Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Zawiadomienie do prokuratury ws. Tuska. Publiczne nawoływanie do zbrodni z ostatniej chwili
Zawiadomienie do prokuratury ws. Tuska. "Publiczne nawoływanie do zbrodni"

Prokuratura postawiła Robertowi Bąkiewiczowi trzy zarzuty po jego wystąpieniu na wiecu PiS w Warszawie. Lider Ruchu Obrony Granic w odpowiedzi składa zawiadomienie na Donalda Tuska.

Ośrodek Monitorowania Zachowań Rasistowskich i Ksenofobicznych nie wykonał wyroku. Komornik zajął rachunek fundacji Wiadomości
Ośrodek Monitorowania Zachowań Rasistowskich i Ksenofobicznych nie wykonał wyroku. Komornik zajął rachunek fundacji

OMZRiK ma poważne problemy prawne i finansowe. Komornik zajął rachunek fundacji po tym, jak ta nie wykonała prawomocnego wyroku nakazującego przeprosiny Agaty Schrötter.

Ważna wiadomość dla klientów T-Mobile. Otrzymają zwrot pieniędzy z ostatniej chwili
Ważna wiadomość dla klientów T-Mobile. Otrzymają zwrot pieniędzy

T-Mobile przyzna rekompensatę klientom, których rachunki wzrosły przez utratę rabatu po nieterminowej płatności – poinformował w czwartek w komunikacie Urząd Ochrony Konkurencji i Konsumentów. Operator zaznaczył, że zakwestionowanego przez Urząd rozwiązania nie stosuje od prawie trzech lat.

Ekspert: Tzw. szablon praworządności Iustiii nie ma nic wspólnego z praworządnością tylko u nas
Ekspert: Tzw. "szablon praworządności" Iustiii nie ma nic wspólnego z praworządnością

Spór o "praworządność" wchodzi w nową fazę. Ekspert krytykuje proponowany przez „Iustitię” tzw. „szablon praworządności”, w związku z brakiem podstawy w obowiązującym prawie i w związku ze sprzecznością z konstytucyjną zasadą legalizmu. Chodzi o sposób wyłaniania sędziowskich członków KRS.

Jak Polacy uratowali Wielki Zderzacz Hadronów z ostatniej chwili
Jak Polacy uratowali Wielki Zderzacz Hadronów

Wyłączenie jednego z poddetektorów systemu FIT mogło sparaliżować eksperyment ALICE w CERN. Po zakończeniu współpracy z Rosją i jej sprzętem zabrakło dokumentacji i wsparcia technicznego dla kluczowego urządzenia. Odpowiedzialność przejęli polscy inżynierowie i naukowcy.

Komunikat dla mieszkańców woj. śląskiego z ostatniej chwili
Komunikat dla mieszkańców woj. śląskiego

Ferie za złotówkę z Kolejami Śląskimi! Od 13 lutego do 1 marca dzieci i młodzież w wieku 4–18 lat będą podróżować pociągami Kolei Śląskich za 1 zł – informuje Województwo Śląskie.

Jest wyrok TSUE w sprawie WIBOR. Ważna decyzja dla milionów Polaków z ostatniej chwili
Jest wyrok TSUE w sprawie WIBOR. Ważna decyzja dla milionów Polaków

Trybunał Sprawiedliwości UE orzekł w czwartek, że klauzula umowy na kredyt mieszkaniowy, zawierająca wskaźnik taki jak WIBOR, nie powoduje znaczącej nierównowagi między stronami na niekorzyść konsumenta. Według TSUE bank nie musi przekazywać konsumentowi szczegółowych informacji na temat metodologii tego wskaźnika.

Wiadomości
Amerykańska Kongresmen: Czas przywrócić suwerenność narodom Europy

Kongresmen Anna Paulina Luna – konserwatywna polityk Partii Republikańskiej i członkini Izby Reprezentantów USA – wezwała w mediach społecznościowych do „przywrócenia suwerenności narodom Europy” oraz do odejścia od scentralizowanych struktur politycznych, takich jak Unia Europejska. Jej słowa wywołały szeroką dyskusję na temat roli instytucji ponadnarodowych i prawa państw do decydowania o własnej polityce.

Co w przypadku ataku Rosji na przesmyk suwalski? Szef NATO odpowiada gorące
Co w przypadku ataku Rosji na przesmyk suwalski? Szef NATO odpowiada

Przesmyk suwalski znów znalazł się w centrum uwagi. Szef NATO Mark Rutte jasno zadeklarował, że jakakolwiek próba jego zablokowania przez Rosję spotka się z natychmiastową i zdecydowaną reakcją całego Sojuszu.

Pilne doniesienia z granicy. Jest komunikat Straży Granicznej z ostatniej chwili
Pilne doniesienia z granicy. Jest komunikat Straży Granicznej

Straż Graniczna publikuje raporty dotyczące wydarzeń na polskiej granicy z Białorusią. Ponadto zaraportowano także o sytuacji na granicy z Litwą i Niemcami w związku z przywróceniem na nich tymczasowych kontroli.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane