Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
„Islamska Republika Iranu trzyma się mocno” z ostatniej chwili
„Islamska Republika Iranu trzyma się mocno”

Islamska Republika Iranu trzyma się mocno – oceniła w studiu PAP iranistka Urszula Pytkowska-Jakimczyk. Wyjaśniła, że Iran spodziewał się amerykańsko-izraelskiego ataku, a sam przywódca Iranu ajatollah Ali Chamenei już wcześniej zapowiedział, że chce oddać życie za swój naród i stać się męczennikiem.

Multikulti po brytyjsku. Co 60 minut gwałcona jest kobieta z ostatniej chwili
Multikulti po brytyjsku. Co 60 minut gwałcona jest kobieta

Jak poinformował portal European Conservative, według publicznie dostępnych danych o przestępczości Metropolitan Police Service, w styczniu w Londynie odnotowano łącznie 746 gwałtów.

„Polski SAFE 0 procent”. Nawrocki po spotkaniu z prezesem NBP zaprasza Tuska na rozmowy z ostatniej chwili
„Polski SAFE 0 procent”. Nawrocki po spotkaniu z prezesem NBP zaprasza Tuska na rozmowy

– Znalezienie korzystnej, suwerennej, bezpiecznej, dobrej i efektywnej alternatywy dla programu SAFE było tematem spotkania z prezesem NBP Adamem Glapińskim – powiedział prezydent Karol Nawrocki po spotkaniu z prezesem NBP. Prezydent przekazał również, iż dziś wystosuje pismo do premiera Donalda Tuska i wicepremiera Władysława Kosiniaka-Kamysza, zapraszając na spotkanie wokół polskiego SAFE 0 proc.

Atak na Iran. Tusk ugiął się pod presją, wyśle samoloty po Polaków z ostatniej chwili
Atak na Iran. Tusk ugiął się pod presją, wyśle samoloty po Polaków

„Podjąłem decyzję o wykorzystaniu samolotów będących w dyspozycji Sił Zbrojnych do wsparcia ewakuacji Polaków z Bliskiego Wschodu. Odpowiedni wniosek w tej sprawie trafił już do prezydenta” – poinformował w środę po południu premier Donald Tusk.

Pentagon: Wkrótce będziemy mieli całkowitą kontrolę nieba nad Iranem, jest już po nich z ostatniej chwili
Pentagon: Wkrótce będziemy mieli całkowitą kontrolę nieba nad Iranem, jest już po nich

– Wkrótce będziemy mieć całkowitą kontrolę nieba nad Iranem – zapowiedział w środę szef Pentagonu Pete Hegseth. Ogłosił, że USA wygrywają wojnę, a Iran wie, że jest już po nim. Hegseth poinformował też o pierwszym od 1945 r. zatopieniu okrętu przeciwnika przez amerykański okręt podwodny.

Wojna na Bliskim Wschodzie. Jest nowy komunikat Wizz Air z ostatniej chwili
Wojna na Bliskim Wschodzie. Jest nowy komunikat Wizz Air

Węgierski Wizz Air do 15 marca włącznie przedłuża zawieszenie wszystkich lotów do i z Izraela, Dubaju, Abu Zabi oraz Ammanu – poinformował w środę przewoźnik. Loty z Wielkiej Brytanii do Dżuddy i Medyny zostaną wznowione zgodnie z planem – 8 marca – dodano.

Ważny komunikat NBP. Rada Polityki Pieniężnej obniża stopy procentowe z ostatniej chwili
Ważny komunikat NBP. Rada Polityki Pieniężnej obniża stopy procentowe

Jest decyzja w sprawie stóp procentowych w Polsce. Narodowy Bank Polski w środę poinformował, że Rada Polityki Pieniężnej zdecydowała o ich obniżeniu. Zmiana wynosi 0,25 punktu procentowego i zacznie obowiązywać od 5 marca 2026 roku.

Copa-Cogeca: Wełna to nie odpady, to zasób! Czas, aby UE usunęła bariery prawne i pobudziła sektor z ostatniej chwili
Copa-Cogeca: Wełna to nie odpady, to zasób! Czas, aby UE usunęła bariery prawne i pobudziła sektor

Copa i Cogeca opublikowały dziś nowe stanowisko w sprawie waloryzacji wełny, naturalnego materiału o wielu cennych właściwościach. Organizacje podkreślają, że wełna jest coraz częściej traktowana jako obciążenie, pomimo wyraźnych możliwości jej wykorzystania. W dokumencie wzywa się decydentów UE do usunięcia barier regulacyjnych, które obecnie uniemożliwiają pełną eksploatację wełny jako zrównoważonego, okrągłego i odnawialnego zasobu rolnego.

Rosyjska obrona zestrzeliła własny śmigłowiec. Cała załoga zginęła na miejscu Wiadomości
Rosyjska obrona zestrzeliła własny śmigłowiec. Cała załoga zginęła na miejscu

Podczas nocnej operacji obrony powietrznej doszło do tragicznej pomyłki. W trakcie odpierania ataku własne systemy miały strącić rosyjską maszynę, co zakończyło się śmiercią całej załogi.

Iran wystrzelił rakietę w stronę Turcji. Jest reakcja NATO z ostatniej chwili
Iran wystrzelił rakietę w stronę Turcji. Jest reakcja NATO

Rzecznik prasowa Sojuszu Północnoatlantyckiego Allison Hart w środę potępiła działania Iranu, który tego dnia wystrzelił pocisk balistyczny w kierunku przestrzeni powietrznej Turcji.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane