Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Liderzy Patriotów dla Europy przyjadą do Budapesztu na Wielkie Zgromadzenie z ostatniej chwili
Liderzy Patriotów dla Europy przyjadą do Budapesztu na Wielkie Zgromadzenie

Wielkie Zgromadzenie Patriotów dla Europy, prawicowej grupy w Parlamencie Europejskim, odbędzie się w Budapeszcie w poniedziałek 23 marca - przekazały węgierskie media. W wydarzeniu uczestniczyć będzie m.in. wicemarszałek Sejmu RP Krzysztof Bosak.

„Unijny dyktat budżetowy w natarciu” z ostatniej chwili
„Unijny dyktat budżetowy w natarciu”

„UNIJNY DYKTAT BUDŻETOWY W NATARCIU” - tymi słowami doradca prezydenta ds. europejskich dr Jacek Saryusz-Wolski opisał na platformie X rozpoczynający się dzisiaj szczyt Unii Europejskiej.

Komunikat dla mieszkańców Katowic Wiadomości
Komunikat dla mieszkańców Katowic

Katowicki magistrat zamierza kupić budynek usługowo-biurowy dawnego banku przy ul. Powstańców za 37 mln zł. Według miasta obiekt przy ul. Francuskiej, z którego zostanie tam przeniesione osiem wydziałów, nie spełnia wymagań, a zakup będzie korzystniejszy niż wynajem powierzchni.

Pewny awans Barcelony. Dwie bramki Lewandowskiego w Lidze Mistrzów Wiadomości
Pewny awans Barcelony. Dwie bramki Lewandowskiego w Lidze Mistrzów

Barcelona pokonała przed własną publicznością Newcastle United 7:2 w rewanżowym meczu 1/8 finału piłkarskiej Ligi Mistrzów i awansowała do kolejnej rundy. Dwie bramki uzyskał Robert Lewandowski. W ubiegłym tygodniu w Anglii był remis 1:1.

Trwa zbiórka na rzecz Tomasza Duklanowskiego i wolności prasy w Polsce Wiadomości
Trwa zbiórka na rzecz Tomasza Duklanowskiego i wolności prasy w Polsce

Na platformie Fundatorres ruszyła zbiórka pieniędzy dla Centrum Monitoringu Wolności Prasy SDP. Organizacja od lat pomaga dziennikarzom w obronie ich praw i niezależności. Obecna kampania skupia się na wsparciu Tomasza Duklanowskiego, który w ostatnich latach stał się celem licznych działań prawnych po ujawnianiu trudnych spraw publicznych.

Pożar na Białołęce opanowany. Strażacy zakończyli akcję ratunkową z ostatniej chwili
Pożar na Białołęce opanowany. Strażacy zakończyli akcję ratunkową

Strażacy dogasili pożar na warszawskiej Białołęce. Zapaliła się tam elewacja nowo powstającego budynku. W wyniku pożaru uszkodzona została konstrukcja dźwigu. Jego operator trafił do szpitala. Ewakuowano także mieszkańców pobliskiego bloku i trzech budynków jednorodzinnych.

Samuel Pereira: Wtedy żądali żeby Prezydent nie przyjmował ślubowania od sędziów, teraz twierdzą, że ma obowiązek przyjąć tylko u nas
Samuel Pereira: Wtedy żądali żeby Prezydent nie przyjmował ślubowania od sędziów, teraz twierdzą, że ma obowiązek przyjąć

Prezydent może odmówić przyjęcia ślubowania od sędziów Trybunału Konstytucyjnego – twierdzi Samuel Pereira. Publicysta przekonuje, że w sporze o prerogatywy głowy państwa dochodzi do politycznych podwójnych standardów i wskazuje na kontrowersje wokół działań obozu Donalda Tuska.

Jechał hulajnogą po S8. Tłumaczenie 28-latka zaskakuje Wiadomości
Jechał hulajnogą po S8. Tłumaczenie 28-latka zaskakuje

Do zaskakującej sytuacji doszło we wtorkowy poranek w województwie łódzkim. Policjanci zatrzymali mężczyznę, który… poruszał się hulajnogą elektryczną po drodze ekspresowej S8.

Barcelona chce zatrzymać Lewandowskiego? Jest jasny sygnał Wiadomości
Barcelona chce zatrzymać Lewandowskiego? Jest jasny sygnał

Wybór Joana Laporty na prezesa FC Barcelona na kolejną kadencję daje szansę na przedłużenie kontraktu Roberta Lewandowskiego. Sam działacz przyznaje, że chciałby, aby Polak, który pomógł klubowi w trudnym momencie, dalej nosił koszulkę „Dumy Katalonii”.

IMGW wydał nowy komunikat. Prognoza pogody na najbliższe dni Wiadomości
IMGW wydał nowy komunikat. Prognoza pogody na najbliższe dni

Jak informuje Instytut Meteorologii i Gospodarki Wodnej, w czwartek w Polsce zachmurzenie umiarkowane i duże, a miejscami również rozpogodzenia. Lokalnie na wschodzie i południowym wschodzie przelotne opady deszczu, a wysoko w Karpatach deszczu ze śniegiem i śniegu. Rano miejscami silne zamglenia i mgły ograniczające widzialność do 200-400 m (lokalnie do 100 m), które miejscami w rejonie Wybrzeża mogą się utrzymywać do godzin popołudniowych.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane