Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Gwiazdor Barcelony z kontuzją. Wypadnie z gry na dłużej Wiadomości
Gwiazdor Barcelony z kontuzją. Wypadnie z gry na dłużej

Pedri (Pedro González López), kluczowy pomocnik FC Barcelony, nabawił się kontuzji prawego ścięgna podkolanowego podczas środowego meczu Ligi Mistrzów ze Slavią Praga i będzie pauzował około miesiąca.

Zwróciła się od transseksualisty per pan. Pielęgniarka zawieszona po incydencie w szpitalu z ostatniej chwili
Zwróciła się od transseksualisty per "pan". Pielęgniarka zawieszona po incydencie w szpitalu

Na Wyspach swój koniec znajduje właśnie absurdalna historia! Pielęgniarka, która została zaatakowana przez pedofila-transseksualistę, ma szansę wywalczyć dla siebie sprawiedliwość. Kobieta padła ofiarą przestępcy za to, że zwróciła się do niego... per pan.

Polski Związek Narciarski ogłosił skład na zimowe igrzyska olimpijskie Wiadomości
Polski Związek Narciarski ogłosił skład na zimowe igrzyska olimpijskie

Polski Związek Narciarski ogłosił nazwiska 21 zawodników, którzy wystąpią w zimowych igrzyskach olimpijskich w Mediolanie i Cortinie d'Ampezzo. Wśród nich jest pięcioro skoczków, w tym Kamil Stoch, siedmioro biegaczy, dwóch kombinatorów, troje narciarzy alpejskich oraz czworo snowboardzistów.

Wszystko jest oceniane. Gwiazda Klanu przerwała milczenie Wiadomości
"Wszystko jest oceniane". Gwiazda Klanu przerwała milczenie

Agnieszka Kaczorowska od lat funkcjonuje w świecie show-biznesu, zdobywając popularność już jako dziecko w serialu „Klan”. Dorastając na oczach widzów, poznała zarówno radość sukcesu, jak i trudności związane z życiem publicznym.

Francja przechwyciła tankowiec rosyjskiej floty cieni na Morzu Śródziemnym Wiadomości
Francja przechwyciła tankowiec rosyjskiej floty cieni na Morzu Śródziemnym

Prezydent Francji Emmanuel Macron poinformował w czwartek, że siły francuskie przeprowadziły operację na Morzu Śródziemnym wobec tankowca płynącego z Rosji i objętego sankcjami międzynarodowymi. Dodał, że wszczęto śledztwo i jednostka została skierowana na inną trasę.

Pożar hali magazynowej w woj. małopolskim. Apel straży pożarnej Wiadomości
Pożar hali magazynowej w woj. małopolskim. Apel straży pożarnej

Pali się hala magazynowa w Trzebini (woj. małopolskie). Nie ma osób poszkodowanych, ale straż pożarna prosi mieszkańców o zamknięcie okien na czas trwania akcji gaśniczej.

Coś pękło w Niemczech. Przełomowy raport Fundacji Adenauera ws. multikulturalizmu z ostatniej chwili
Coś pękło w Niemczech. Przełomowy raport Fundacji Adenauera ws. multikulturalizmu

Fundacja Konrada Adenauera opublikowała raport oparty na reprezentatywnej ankiecie, z którego wynika, że mieszkańcy Niemiec coraz częściej odrzucają model klasycznego multikulturalizmu.

Chiny budują potężny teleskop kosmiczny. Ma przewyższyć Hubble’a Wiadomości
Chiny budują potężny teleskop kosmiczny. Ma przewyższyć Hubble’a

Chiny przygotowują się do jednego z najważniejszych projektów kosmicznych ostatnich lat. Na niską orbitę okołoziemską ma trafić Chiński Teleskop Stacji Kosmicznej (CSST), znany również jako Xuntian, co oznacza „badanie nieba”. Jego start planowany jest na początek 2027 roku.

Komunikat dla mieszkańców Lublina Wiadomości
Komunikat dla mieszkańców Lublina

Mieszkańcy Lublina powinni zachować szczególną ostrożność w najbliższych dniach. Instytut Meteorologii i Gospodarki Wodnej wydał ostrzeżenie pierwszego stopnia dotyczące opadów marznących, które mogą znacząco utrudnić poruszanie się po mieście.

Sprawa Iwony Wieczorek wciąż budzi emocje. Prokuratura zabiera głos Wiadomości
Sprawa Iwony Wieczorek wciąż budzi emocje. Prokuratura zabiera głos

Choć od zaginięcia Iwony Wieczorek minęło już niemal 16 lat, sprawa wciąż budzi ogromne emocje. Ostatnio ponownie zrobiło się o niej głośno, głównie za sprawą informacji o działaniach prokuratury w Sopocie. Prokuratura Krajowa postanowiła jednak zdementować doniesienia łączące te czynności bezpośrednio z tą głośną sprawą.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane