Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Hanna Radziejowska i Mateusz Fałkowski przywróceni do pracy w Instytucie Pileckiego z ostatniej chwili
Hanna Radziejowska i Mateusz Fałkowski przywróceni do pracy w Instytucie Pileckiego

Instytut Solidarności i Męstwa im. Witolda Pileckiego poinformował w czwartek, że Hanna Radziejowska oraz Mateusz Fałkowski na mocy zawartego z Instytutem porozumienia zostają przywróceni do pracy w berlińskim oddziale.

Sikorski ma towarzyszyć prezydentowi Nawrockiemu na Zgromadzeniu Ogólnym ONZ z ostatniej chwili
Sikorski ma towarzyszyć prezydentowi Nawrockiemu na Zgromadzeniu Ogólnym ONZ

Udział w 80. sesji Zgromadzenia Ogólnego ONZ rozpoczynającej się w niedzielę, oprócz prezydenta weźmie również szef MSZ Radosław Sikorski. Będzie to pierwszy raz, kiedy szef polskiej dyplomacji będzie towarzyszyć prezydentowi Nawrockiemu w jego zagranicznej wizycie – informuje Polska Agencja Prasowa.

Zostaję czy opuszczam kraj w razie ataku Rosji? Polacy zdecydowali z ostatniej chwili
Zostaję czy opuszczam kraj w razie ataku Rosji? Polacy zdecydowali

70 proc. badanych Polaków zadeklarowało, że nie wyjedzie z Polski w razie rosyjskiej agresji; przeciwne deklaracje złożyło 30 proc. ankietowanych – wynika z opublikowanego w czwartek sondażu Instytutu Badań Pollster dla „Super Expressu”.

Szef MON w Kijowie. Ogłosił podpisanie porozumienia z Ukrainą z ostatniej chwili
Szef MON w Kijowie. Ogłosił podpisanie porozumienia z Ukrainą

– Podpiszemy z ukraińskim resortem obrony porozumienie o współpracy dotyczące m.in. zdobywania umiejętności w zakresie operowania dronami – powiedział w czwartek wicepremier, szef MON Władysław Kosiniak-Kamysz podczas wizyty w Kijowie.

Groźna bakteria w Niemczech. Naukowcy: wyjątkowo agresywna i rzadko spotykana w Europie z ostatniej chwili
Groźna bakteria w Niemczech. Naukowcy: wyjątkowo agresywna i rzadko spotykana w Europie

W niemieckim landzie Meklemburgia-Pomorze Przednie od ponad miesiąca notuje się rosnącą liczbę zakażeń bakterią EHEC. Mimo intensywnych działań służb sanitarnych wciąż nie udało się jednoznacznie wskazać źródła infekcji. We wrześniu naukowcy zidentyfikowali występujący w regionie szczep jako wyjątkowo agresywny i rzadko spotykany w Europie.

Donald Trump zdecydował ws. Antify. Chora, niebezpieczna, radykalnie lewicowa katastrofa Wiadomości
Donald Trump zdecydował ws. Antify. "Chora, niebezpieczna, radykalnie lewicowa katastrofa"

Prezydent USA Donald Trump ogłosił w czwartek, że uznał Antifę za organizację terrorystyczną. Polecił również zbadanie osób finansujących działalność tego ruchu.

Badanie zaufania do służb. Policji się to nie spodoba z ostatniej chwili
Badanie zaufania do służb. Policji się to nie spodoba

Policji ufa niewiele ponad 63 proc. Polaków, a straży miejskiej 51 proc. – wynika z badania IBRiS dla PAP. Niezmiennie od wielu lat niemal wszyscy badani deklarują natomiast zaufanie do straży pożarnej.

Wykłady nt. wpływu myśli chrześcijańskiej na społeczeństwo i gospodarkę Wiadomości
Wykłady nt. wpływu myśli chrześcijańskiej na społeczeństwo i gospodarkę

Powszechny Uniwersytet Nauczania Chrześcijańsko-Społecznego (PUNCS) to działanie edukacyjne prowadzone przez fundację Instytut Myśli Schumana.

Siemoniak przyznał: „W Wyrykach spadła nasza rakieta” z ostatniej chwili
Siemoniak przyznał: „W Wyrykach spadła nasza rakieta”

Tomasz Siemoniak w rozmowie z Moniką Olejnik w TVN24 przyznał, że w Wyrykach spadła polska rakieta wystrzelona z F-16. Dom został uszkodzony, a mieszkańcy mogą wrócić tylko na parter. Minister tłumaczy się, że „świat nie jest taki prosty”.

Jak protestować przeciwko Centrom Integracji Cudzoziemców - jest raport gorące
Jak protestować przeciwko Centrom Integracji Cudzoziemców - jest raport

W środę 17 września Instytut na rzecz Kultury Prawnej Ordo Iuris opublikował swój nowy raport pod tytułem „Podstawy sprzeciwu wobec koncepcji Centrów Integracji Cudzoziemców. Odpowiedzialna polityka migracyjna wymaga selekcji, deportacji i asymilacji”.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane
Emerytury
Stażowe