Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Orban o działaniach UE ws. rosyjskich aktywów: Brukselczycy przekraczają Rubikon, nastała dyktatura z ostatniej chwili
Orban o działaniach UE ws. rosyjskich aktywów: Brukselczycy przekraczają Rubikon, nastała dyktatura

„Brukselczycy przekraczają Rubikon, nastała brukselska dyktatura; Węgry protestują przeciwko tej decyzji i zrobią wszystko, co w ich mocy, aby przywrócić porządek prawny” - napisał w piątek na Facebooku węgierski premier Viktor Orban, komentując najnowsze decyzje UE ws. zamrożonych rosyjskich aktywów.

Irakijczyk Barham Ahmed Salih nowym Wysokim Komisarzem ONZ ds. Uchodźców. A co z Hołownią? z ostatniej chwili
Irakijczyk Barham Ahmed Salih nowym Wysokim Komisarzem ONZ ds. Uchodźców. A co z Hołownią?

O stanowisko nowego Wysokiego Komisarza ONZ ds. Uchodźców ubiegał się Szymon Hołownia. Jednak został na niego wybrany były prezydent Iraku Barham Salih.

Samochody będą droższe i będzie ich mniej. PE i Rada UE zawarły porozumienie w sprawie sektora motoryzacyjnego z ostatniej chwili
Samochody będą droższe i będzie ich mniej. PE i Rada UE zawarły porozumienie w sprawie sektora motoryzacyjnego

Wczesnym rankiem w piątek Parlament Europejski i Rada UE osiągnęły tymczasowe porozumienie w sprawie nowych unijnych przepisów dotyczących obiegu zamkniętego, które mają objąć cały cykl życia pojazdu, od projektu po ostateczne traktowanie na koniec cyklu życia.

Tłum nielegalnych imigrantów sforsował granicę na wschodzie. Trwa akcja Straży Granicznej z ostatniej chwili
Tłum nielegalnych imigrantów sforsował granicę na wschodzie. Trwa akcja Straży Granicznej

Ponad 180 cudzoziemców przedostało się w czwartek kilkudziesięciometrowym wykopanym tunelem pod granicą polsko-białoruską – ustaliła PAP w Straży Granicznej. Liczbę osób ustalono dzięki systemom elektronicznym, a niedługo później zatrzymano ponad 130 osób; trwają poszukiwania pozostałych migrantów.

Pilne doniesienia z granicy. Jest komunikat Straży Granicznej z ostatniej chwili
Pilne doniesienia z granicy. Jest komunikat Straży Granicznej

Funkcjonariusze Nadbużańskiego Oddziału Straży Granicznej wydalili z Polski trzech obywateli Gruzji zatrzymanych za kradzieże i rozboje. Mężczyźni, po opuszczeniu zakładu karnego w Hrubieszowie, otrzymali decyzje o zobowiązaniu do powrotu oraz wieloletni zakaz ponownego wjazdu do Polski i strefy Schengen.

Rosyjski sąd zajmie się instytucją mrożącą rosyjskie aktywa. Jest pozew z ostatniej chwili
Rosyjski sąd zajmie się instytucją mrożącą rosyjskie aktywa. Jest pozew

Rosyjski bank centralny poinformował w piątek, że pozwał przed sądem w Moskwie Euroclear, instytucję finansową z siedzibą w Brukseli, która zajmuje się obsługą transakcji na rynkach kapitałowych.

Skandal w Ochotniczej Straży Pożarnej. Prezes jednostki oskarżony o molestowanie podwładnych nastolatek z ostatniej chwili
Skandal w Ochotniczej Straży Pożarnej. Prezes jednostki oskarżony o molestowanie podwładnych nastolatek

Prokuratura Rejonowa w Opolu postawiła prezesowi jednej z jednostek OSP poważne zarzuty dotyczące molestowania sześciu dziewcząt, w większości niepełnoletnich. Według śledczych mężczyzna miał wykorzystywać swoją pozycję w strukturach straży pożarnej.

Ważny komunikat dla mieszkańców Katowic Wiadomości
Ważny komunikat dla mieszkańców Katowic

Już w poniedziałek 15 grudnia kierowcy, piesi i rowerzyści będą mogli korzystać z nowych wiaduktów na ul. Bohaterów Monte Cassino w Katowicach. Zakończenie prac oznacza koniec utrudnień na S86 – jednej z najbardziej obciążonych tras w Polsce.

Polacy ocenili rząd na półmetku. Tusk nie otworzy szampana  z ostatniej chwili
Polacy ocenili rząd na półmetku. Tusk nie otworzy szampana 

Negatywnie pracę rządu ocenia 50,5 proc. badanych, pozytywnie 42 proc., a 7,5 proc. respondentów nie ma na ten temat zdania. Wśród negatywnych ocen zdecydowanie przeważały odpowiedzi „zdecydowanie negatywne” (blisko 40 proc.). Wśród osób oceniających pozytywnie dwa lata rządów koalicji opcję „zdecydowanie pozytywnie” wybrało zaledwie niecałe 9 proc. – wynika z sondażu United Surveys dla Wirtualnej Polski.

Zamieszki na ulicach Lizbony. Policja broni parlamentu Wiadomości
Zamieszki na ulicach Lizbony. Policja broni parlamentu

Funkcjonariusze portugalskiej policji udaremnili próbę wdarcia się do budynku parlamentu grupy osób uczestniczących w czwartek wieczorem w antyrządowym wiecu w centrum stolicy kraju, Lizbonie.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane