Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Stanowski poprosił  Żurka o radę. Jestem w kropce z ostatniej chwili
Stanowski poprosił Żurka o radę. "Jestem w kropce"

Krzysztof Stanowski zwrócił się z prośbą o radę bezpośrednio do Waldemara Żurka. Twórca Kanału Zero spytał ministra sprawiedliwości, czy "powinien stosować się do decyzji neosędziów". Chodzi o wyrok, który sędzia Ewa Breś wydała ws. Stanowskiego i Doroty Wysockiej-Schnepf z TVP.

Błaszczak krytykuje utajnienie informacji o projektach SAFE. „Mamy prawo wiedzieć, na co zostaną wydane nasze pieniądze” z ostatniej chwili
Błaszczak krytykuje utajnienie informacji o projektach SAFE. „Mamy prawo wiedzieć, na co zostaną wydane nasze pieniądze”

„Utajnienie informacji o poszczególnych projektach, a nawet o ogólnych założeniach przekazanego dokumentu oceniam negatywnie. Fundusz SAFE to pożyczki, które Polacy będą spłacali przez dekady ze swoich podatków. Mamy prawo wiedzieć na co zostaną wydane nasze pieniądze” - napisał były minister obrony narodowej Mariusz Błaszczak na platformie X.

Uwaga, uwaga, zostawili Niemcom tylne drzwi do programu 'Orka' gorące
"Uwaga, uwaga, zostawili Niemcom tylne drzwi do programu 'Orka'"

Polska wybrała szwedzkiego producenta do dostarczenia trzech nowych okrętów w ramach programu Orka, co ma zastąpić przestarzały ORP „Orzeł” i wzmocnić zdolności Marynarki Wojennej. Okazuje się jednak, że zostawiono Niemcom możliwość przejęcia kontraktu.

Farmy wiatrowe mogą podgrzewać ocean i atmosferę Wiadomości
Farmy wiatrowe mogą podgrzewać ocean i atmosferę

Farmy wiatrowe mogą podgrzewać ocean i atmosferę - wynika z najnowszych badań amerykańskich naukowców opublikowanych w piśmie "Science".

Strzelanina podczas przyjęcia urodzinowego dziecka. Wielu zabitych i rannych Wiadomości
Strzelanina podczas przyjęcia urodzinowego dziecka. Wielu zabitych i rannych

Cztery osoby zginęły, a 10 zostało rannych w sobotniej strzelaninie podczas przyjęcia urodzinowego dziecka w sali bankietowej w Stockton w stanie Kalifornia w USA. Sprawca pozostaje na wolności – poinformowała lokalna stacja KCRA.

Szokujący wpis Radosława Sikorskiego dotyczący chorych dzieci: „Wystarczy im bon zdrowotny” gorące
Szokujący wpis Radosława Sikorskiego dotyczący chorych dzieci: „Wystarczy im bon zdrowotny”

Minister Spraw Zagranicznych Radosław Sikorski na platformie X usiłował wyjaśnić, dlaczego uważa, że 100 mln dolarów, jakie z polskiego budżetu popłynie dla Ukrainy, to niewiele. Doszło przy tym do szokującej konwersacji z jednym z internautów.

Tusk podjął decyzję ws. stanów alarmowych w Polsce z ostatniej chwili
Tusk podjął decyzję ws. stanów alarmowych w Polsce

Premier Donald Tusk zdecydował o przedłużeniu obowiązywania trzech stopni alarmowych na terenie całego kraju. Informację potwierdziło Rządowe Centrum Bezpieczeństwa, publikując szczegóły nowych zarządzeń.

Palestyńskie ministerstwo zdrowia: Od rozpoczęcia izraelskiej ofensywy w Gazie zginęło ponad 70 000 osób z ostatniej chwili
Palestyńskie ministerstwo zdrowia: Od rozpoczęcia izraelskiej ofensywy w Gazie zginęło ponad 70 000 osób

Według prowadzonego przez Hamas ministerstwa zdrowia terytorium palestyńskiego w wyniku izraelskiej kampanii wojskowej w Gazie zginęło ponad 70 000 Palestyńczyków.

Prezydent Nawrocki ogranicza wizytę na Węgrzech Wiadomości
Prezydent Nawrocki ogranicza wizytę na Węgrzech

Prezydent Karol Nawrocki zdecydował się ograniczyć program swojej wizyty na Węgrzech wyłącznie do szczytu prezydentów Grupy Wyszehradzkiej w Ostrzyhomiu - poinformował w niedzielę na X szef Biura Polityki Międzynarodowej Marcin Przydacz.

Wytyczenie korytarza kolei dużych prędkości do Niemiec priorytetem rządu Donalda Tuska Wiadomości
Wytyczenie korytarza kolei dużych prędkości do Niemiec priorytetem rządu Donalda Tuska

Wiceszef resortu infrastruktury Piotr Malepszak powiedział PAP, że sprawa wytyczenia linii kolei dużych prędkości (KDP) między Polską a Niemcami będzie jednym z tematów poniedziałkowych rozmów międzyrządowych w Berlinie. Dodał, że w pierwszej kolejności należy usprawnić istniejące trasy.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane