Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Tȟašúŋke Witkó: Tępe nożyce niemiecko–rosyjskie tylko u nas
Tȟašúŋke Witkó: Tępe nożyce niemiecko–rosyjskie

W tych trudny, pełnych zawirowań czasach mam dla Państwa dwie wspaniałe wiadomości. Otóż, pierwsza jest taka, że Niemcy nie są w stanie skompletować oddziału złożonego z, raptem, 5 tys. gemajnów, aby wysłać na Litwę obiecaną brygadę pancerną, mającą bronić sojuszników przed rosyjską agresją, gdyż nikt z Teutonów nie garnie się do służby poza granicami państwa. Druga – jeszcze lepsza – głosi, że pogrobowcy Kraju Rad w ostatnim czasie stracili na froncie ukraińskim więcej sołdatów, niż byli w stanie wcielić

Sąd Najwyższy ogranicza cła. Trump zapowiada nowe taryfy Wiadomości
Sąd Najwyższy ogranicza cła. Trump zapowiada nowe taryfy

Prezydent USA Donald Trump oskarżył w piątek Sąd Najwyższy o uleganie obcym wpływom oraz zapowiedział wprowadzenie nowych tymczasowych 10-procentowych ceł na towary z całego świata. To reakcja prezydenta na unieważnienie przez Sąd większości nałożonych przez niego ceł.

Tusk ma powody do niepokoju. Nowe wyniki sondażu CBOS Wiadomości
Tusk ma powody do niepokoju. Nowe wyniki sondażu CBOS

W lutym br. 34 proc. ankietowanych popiera rząd, 41 proc. jest mu przeciwnych, a 22 proc. wyraziło obojętność – wynika z najnowszego sondażu CBOS. Sondażownia odnotowała minimalny spadek ocen premiera - 35 proc. badanych wyraża zadowolenie z faktu, że funkcję szefa rządu sprawuje Donald Tusk.

GIS ostrzega przed skażonym produktem spożywczym Wiadomości
GIS ostrzega przed skażonym produktem spożywczym

Główny Inspektorat Sanitarny wydał w piątek ostrzeżenie dotyczące wykrycia bakterii Salmonella spp. na powierzchni skorupek jaj. Spożycie produktu zanieczyszczonego pałeczkami Salmonella, zwłaszcza bez odpowiedniej obróbki termicznej, wiąże się z ryzykiem zatrucia pokarmowego.

CDU ponownie stawia na Merza. Jednogłośny wybór w Stuttgarcie Wiadomości
CDU ponownie stawia na Merza. Jednogłośny wybór w Stuttgarcie

Zgodnie z oczekiwaniami kanclerz Niemiec Friedrich Merz został w piątek ponownie wybrany na stanowisko przewodniczącego CDU na zjeździe partyjnym tego chadeckiego ugrupowania w Stuttgarcie.

Tragedia na Majorce. Nie żyje 47-letni Polak Wiadomości
Tragedia na Majorce. Nie żyje 47-letni Polak

Policyjna interwencja w Palmie na Majorce zakończyła się śmiercią 47-letniego Polaka. Mężczyzna zmarł po użyciu paralizatora przez funkcjonariuszy. Do zdarzenia doszło nad ranem 19 lutego w dzielnicy Coll d’en Rabassa. Okoliczności tragedii wyjaśnia wydział zabójstw.

Zacharowa reaguje na decyzję Polski: Konsekwencje nie będą długo czekać” pilne
Zacharowa reaguje na decyzję Polski: "Konsekwencje nie będą długo czekać”

Wycofanie się Polski z konwencji ottawskiej wywołało natychmiastową reakcję Moskwy. Rosyjskie MSZ ostrzega przed „efektem domina” i dalszą eskalacją napięć w Europie.

Komunikat dla mieszkańców Gdańska Wiadomości
Komunikat dla mieszkańców Gdańska

Rozpoczyna się warta 114,6 mln zł modernizacja nabrzeży w Port Gdańsk, którą zrealizuje spółka PORR - podało w piątek biuro prasowe portu. Inwestycja ma zwiększyć możliwości przeładunkowe i usprawnić logistykę portu.

Groźne żeglarze portugalskie pojawiły się u wybrzeży Teneryfy. Służby alarmują Wiadomości
Groźne żeglarze portugalskie pojawiły się u wybrzeży Teneryfy. Służby alarmują

Niebezpieczne organizmy pojawiły się u wybrzeży jednej z najpopularniejszych wysp wakacyjnych w Europie. Władze Teneryfy zamknęły kąpieliska po tym, jak turysta po kontakcie z aretuzą zwaną żeglarzem portugalskim trafił do szpitala.

Harry próbował pogodzić się z Williamem? Pałac Buckingham przerywa milczenie Wiadomości
Harry próbował pogodzić się z Williamem? Pałac Buckingham przerywa milczenie

Relacje między księciem Harrym a księciem Williamem od lat pozostają napięte. Teraz ponownie pojawiły się sprzeczne doniesienia dotyczące rzekomej próby pojednania między braćmi.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane