Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Michael Schumacher wreszcie wstał z łóżka! Nowe informacje po 12 latach z ostatniej chwili
Michael Schumacher wreszcie wstał z łóżka! Nowe informacje po 12 latach

Przez lata panowała cisza i ścisła tajemnica. Teraz brytyjskie media ujawniają nowe szczegóły dotyczące zdrowia Michaela Schumachera. Legenda Formuły 1 nie jest już przykuta do łóżka i porusza się na wózku inwalidzkim w swoim domu nad Jeziorem Genewskim. To pierwsze tak konkretne doniesienia od lat.

KRS odpowiada na wtargnięcie służb do siedziby. Będzie zawiadomienie do prokuratury z ostatniej chwili
KRS odpowiada na wtargnięcie służb do siedziby. Będzie zawiadomienie do prokuratury

Prezydium Krajowej Rady Sądownictwa upoważniło szefową KRS do złożenia zażalenia na niedawne przeszukanie biur w siedzibie Rady. Złożone ma zostać też w prokuraturze zawiadomienie w związku z tym, że według prezydium KRS, działania policji i prokuratury uniemożliwiły członkom Rady podjęcie pracy.

Wyłączenia prądu na Śląsku. Ważny komunikat dla mieszkańców z ostatniej chwili
Wyłączenia prądu na Śląsku. Ważny komunikat dla mieszkańców

Mieszkańcy województwa śląskiego muszą przygotować się na planowane przerwy w dostawie energii elektrycznej. Operator sieci dystrybucyjnej Tauron opublikował harmonogram wyłączeń na najbliższe dni. Przerwy obejmą m.in. Częstochowę, Sosnowiec, Gliwice, Zabrze oraz powiaty częstochowski i gliwicki. Poniżej szczegółowy wykaz – gdzie, kiedy i na jakich ulicach nie będzie prądu.

Żurek chce zaostrzać prawo drogowe. Tymczasem sam łamie przepisy? Jest nagranie z ostatniej chwili
Żurek chce zaostrzać prawo drogowe. Tymczasem sam łamie przepisy? Jest nagranie

Minister sprawiedliwości Waldemar Żurek zapowiadał surowsze traktowanie kierowców łamiących zakazy i większą bezwzględność wymiaru sprawiedliwości. Tego samego dnia w sieci pojawił się wpis, który wywołał burzę. Jak wynika z nagrania, minister miał nie ustąpić pierwszeństwa na pasach i niemal potrącić kobietę.

Zamknięcie porodówki w Wadowicach. Głos zabrał wojewoda z ostatniej chwili
Zamknięcie porodówki w Wadowicach. Głos zabrał wojewoda

To ważna decyzja dla tysięcy mieszkanek Małopolski. Wojewoda małopolski Krzysztof Jan Klęczar nie zgodził się na zamknięcie oddziału ginekologiczno-położniczego w szpitalu powiatowym w Wadowicach. Dyrekcja placówki chciała zawiesić jego działalność już od 1 lutego. Powód? Dramatyczny spadek liczby porodów i ogromne straty finansowe.

Ważny komunikat dla mieszkańców Gdańska z ostatniej chwili
Ważny komunikat dla mieszkańców Gdańska

Ważny komunikat dla mieszkańców Gdańska. Miasto uruchomiło konsultacje społeczne dotyczące dokumentu, który zadecyduje o kierunkach rozwoju komunikacji miejskiej na najbliższe kilkanaście lat. Każdy mieszkaniec może zgłosić swoje uwagi – czasu jest jednak niewiele.

ZUS rusza po pieniądze. Te świadczenia trzeba będzie oddać Wiadomości
ZUS rusza po pieniądze. Te świadczenia trzeba będzie oddać

ZUS wydał komunikat, który może zaniepokoić tysiące świadczeniobiorców. Osoby, które pobrały pieniądze nienależnie – nawet nieświadomie – muszą liczyć się z koniecznością zwrotu środków.

W tajemnicy przed Polakami. Europoseł alarmuje w sprawie specustawy dot. Ukraińców z ostatniej chwili
"W tajemnicy przed Polakami". Europoseł alarmuje w sprawie specustawy dot. Ukraińców

Rada Ministrów przyjęła projekt wygaszający rozwiązania specustawy ukraińskiej. Rząd mówi o przejściu na równe zasady, a Maciej Wąsik ostrzega, że nowe przepisy mogą rozszerzyć ochronę na cudzoziemców spoza Ukrainy.

Rewolucja przy wzywaniu karetki. Ministerstwo zmienia zasady Wiadomości
Rewolucja przy wzywaniu karetki. Ministerstwo zmienia zasady

To jedna z największych zmian w systemie ratownictwa od lat. Ministerstwo Zdrowia szykuje nowe zasady obsługi zgłoszeń pod numerem 112. Dyspozytor medyczny nie zacznie już rozmowy od pytania o adres. Liczyć się będzie coś zupełnie innego — i to ma skrócić czas wysłania karetki nawet w sytuacjach zagrożenia życia.

Kraj skuty lodem. IMGW i RCB ostrzegają: najgorsze dopiero przed nami pilne
Kraj skuty lodem. IMGW i RCB ostrzegają: najgorsze dopiero przed nami

Marznący deszcz, mgła i nagłe oblodzenie dróg mogą dziś sparaliżować znaczną część kraju. IMGW wydał ostrzeżenia dla 13 województw, a RCB rozesłało pilne alerty do milionów Polaków. Eksperci ostrzegają: sytuacja może być niebezpieczna dla kierowców i pieszych nawet do wtorkowego poranka.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane