Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
„Receptą na zwycięstwo jest jedność”. Prezes PiS ostrzega przed podziałami Wiadomości
„Receptą na zwycięstwo jest jedność”. Prezes PiS ostrzega przed podziałami

Prezes PiS Jarosław Kaczyński zaapelował w sobotę do członków partii o jedność w obliczu ostatnich tarć wewnętrznych. „Receptą na zwycięstwo jest jedność, a wszelkie próby jej podważania to realizowanie scenariusza obecnej koalicji rządzącej” - napisał na platformie X Kaczyński.

Tragiczny wypadek w Bielsku. Nie żyje kilkuletnie dziecko Wiadomości
Tragiczny wypadek w Bielsku. Nie żyje kilkuletnie dziecko

Tragiczny wypadek drogowy wydarzył się w sobotę, 28 lutego, około godziny 12:30 na ul. Płockiej w Bielsku (pow. płocki). Ze wstępnych ustaleń policji wynika, że 44-letni kierowca Toyoty na łuku drogi z nieznanych przyczyn zjechał na przeciwległy pas i uderzył w jadący w przeciwnym kierunku samochód ciężarowy marki DAF, którym kierował 50-letni mężczyzna.

Komisja Wenecka akceptuje segregację sędziów. Ekspert: To przekracza granicę, której przekraczać nie wolno tylko u nas
Komisja Wenecka akceptuje segregację sędziów. Ekspert: To przekracza granicę, której przekraczać nie wolno

Czy można „ponownie oceniać” raz powołanych sędziów? Opinia Komisja Wenecka w sprawie tzw. sanacji budzi poważne wątpliwości konstytucyjne. Krytycy ostrzegają: to może być precedens, który zmieni zasady stabilności sądów w Polsce.

Loty nad Bliskim Wschodem mogą być zakłócone. Jest komunikat MSZ z ostatniej chwili
Loty nad Bliskim Wschodem mogą być zakłócone. Jest komunikat MSZ

W związku z trwającą zakrojoną na szeroką skalę operacją militarną na Bliskim Wschodzie prawdopodobne są dalsze zamknięcia przestrzeni lub znaczne utrudnienia w ruchu lotniczym; także nad Jordanią, Arabią Saudyjską, Libanem i Syrią - ostrzegło w sobotę MSZ na platformie X, na profilu „Polak za granicą”.

Przeciwnicy lewicowej ideologii w UE mają być kwalifikowani jako potencjalni terroryści gorące
Przeciwnicy lewicowej ideologii w UE mają być kwalifikowani jako potencjalni terroryści

Komisja Europejska przedstawiła nowy program zapobiegania terroryzmowi i zwalczania go. „Nowy program wyznacza dalsze działania mające na celu wzmocnienie zbiorowej reakcji Europy na zmieniające się zagrożenia terrorystyczne i brutalne zagrożenia ekstremistyczne” - czytamy w komunikacie.

Burza w Tańcu z Gwiazdami. Ta decyzja zaskoczyła widzów Wiadomości
Burza w Tańcu z Gwiazdami. Ta decyzja zaskoczyła widzów

Do rozpoczęcia 18. edycji programu „Taniec z gwiazdami” pozostał tylko jeden dzień, a produkcja zaskoczyła widzów nagłą decyzją. W ostatniej chwili zrezygnowano z pokazywania kulis show w mediach społecznościowych, które w poprzednich sezonach prowadzone były przez byłych uczestników – Julię Suryś i Wojciecha Kucinę.

Belgijska unia rolnicza: Umowa UE-Mercosur to bezprecedensowe przejęcie władzy z ostatniej chwili
Belgijska unia rolnicza: Umowa UE-Mercosur to bezprecedensowe przejęcie władzy

Jak poinformował Brussels Times, FUGEA, belgijska unia rolnicza, uznała tymczasowe wprowadzenie w życie umowy UE-Mercosur, bez oglądania się na demokratyczną i sądową kontrolę ze strony Unii Europejskiej, za “ rażące lekceważenie procesów demokratycznych”.

Ogromny pożar w Wągrowcu. Gęsty dym nad miastem Wiadomości
Ogromny pożar w Wągrowcu. Gęsty dym nad miastem

W sobotnie popołudnie, około godziny 14:30, w Wągrowcu (woj. wielkopolskie) doszło do poważnego pożaru na terenie zakładu produkującego chemię przy ulicy Taszarowo. Ogień objął halę produkcyjną, a nad miastem unosi się gęsty, czarny dym, który jest widoczny z wielu kilometrów.

Reza Pahlawi apeluje do Irańczyków: To interwencja humanitarna, jej celem jest Republika Islamska z ostatniej chwili
Reza Pahlawi apeluje do Irańczyków: To interwencja humanitarna, jej celem jest Republika Islamska

„Pomoc, którą prezydent Stanów Zjednoczonych obiecał dzielnemu narodowi Iranu, właśnie nadeszła. To interwencja humanitarna, a jej celem jest Republika Islamska, jej aparat represji i machina śmierci – a nie kraj i wielki naród Iranu” - zwrócił się do rodaków mieszkający w Stanach Zjednoczonych najstarszy syn ostatniego szacha Iranu Mohammada Rezy Pahlawiego i spadkobierca perskiego tronu.

Skoki narciarskie. Słoweniec triumfuje, Stoch awansuje w drugiej serii Wiadomości
Skoki narciarskie. Słoweniec triumfuje, Stoch awansuje w drugiej serii

Słoweniec Domen Prevc wygrał konkurs Pucharu Świata w skokach narciarskich na mamucim obiekcie Kulm w austriackim Bad Mitterndorf i umocnił się na prowadzeniu w klasyfikacji generalnej cyklu. Kamil Stoch zajął 23. miejsce.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane