Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
tylko u nas
Jeśli prawica chce wygrać, musi budować wokół Nawrockiego

Dzielenie skóry na niedźwiedziu w postaci rozważań pt. „kto będzie premierem z PiS-u” nie ma dziś większego sensu. Prawo i Sprawiedliwość nie wygra samodzielnie wyborów. Tak samo nie zrobi tego Konfederacja. Tym, co może się udać, jest stworzenie wspólnego rządu środowisk prawicowych w Polsce. Jeśli szeroko pojęta prawica chce wygrać w 2027 r., powinna budować swoją siłę wokół Karola Nawrockiego i razem z nim – w praktyce tworząc system prezydencki.

Burza po decyzji Brauna. Ambasador USA w Polsce reaguje z ostatniej chwili
Burza po decyzji Brauna. Ambasador USA w Polsce reaguje

Grzegorz Braun odwiedził ambasadę Iranu w Warszawie i wpisał się do księgi kondolencyjnej po śmierci Alego Chameneiego. Decyzja szefa Konfederacji Korony Polskiej spotkała się z ostrą krytyką ambasadora USA w Polsce.

Atak na Iran. USA podały dane o poległych żołnierzach z ostatniej chwili
Atak na Iran. USA podały dane o poległych żołnierzach

Wczoraj wieczorem amerykański żołnierz zmarł w wyniku obrażeń odniesionych podczas pierwszych ataków irańskiego reżimu na Bliskim Wschodzie – poinformował w niedzielę wieczorem Dowództwo Centralne USA (CENTCOM).

Grafzero: Brzemię pustego morza i Kaduk, czyli wielka niemoc Tadeusz Łopalewski z ostatniej chwili
Grafzero: "Brzemię pustego morza" i "Kaduk, czyli wielka niemoc" Tadeusz Łopalewski

Grafzero razem z Mirkiem z kanału ‪@emigrant41‬ o dwóch powieściach Tadeusza Łopalewskiego: "Brzemię pustego morza" i "Kaduk, czyli wielka niemoc" . Czyli polskie powieści historyczne o losach Rzeczpospolitej w XVII wieku.

Iran wybrał nowego przywódcę. Trump zabrał głos z ostatniej chwili
Iran wybrał nowego przywódcę. Trump zabrał głos

– Następny przywódca Iranu nie przetrwa zbyt długo, jeśli nie będzie miał mojego poparcia – powiedział prezydent USA Donald Trump w niedzielę w wywiadzie dla telewizji ABC. Prezydent nie wykluczył też użycia wojsk lądowych, by przejąć zapasy irańskiego wzbogaconego uranu.

Ks. Janusz Chyła: Boże parytety z ostatniej chwili
Ks. Janusz Chyła: Boże parytety

Czy jesteśmy w stanie ustrzec normalność? W przeżywaniu wiary potrzebujemy zarówno wzorca męskiego, charakteryzującego się racjonalnością i nastawieniem na zewnętrzne działanie, jak i żeńskiego, cechującego się większą sentymentalnością i przeżywaniem wewnętrznym – pisze ks. Janusz Chyła.

Prezydent wręczył odznaczenia zasłużonym kobietom. Odgrywają w Polsce podmiotową rolę z ostatniej chwili
Prezydent wręczył odznaczenia zasłużonym kobietom. "Odgrywają w Polsce podmiotową rolę"

Prezydent Karol Nawrocki wręczył w niedzielę odznaczenia jedenastu kobietom zasłużonym na różnych polach - kultury, edukacji, opieki zdrowotnej czy historii. – Kobiety w Polsce odgrywają podmiotową rolę, a panie są tego najlepszym przykładem – zwrócił się do odznaczonych.

Jakubiak zapytany o Czarnka. Albo Polska będzie, albo Polski nie będzie z ostatniej chwili
Jakubiak zapytany o Czarnka. "Albo Polska będzie, albo Polski nie będzie"

– Bardzo podoba mi się zerojedynkowość, bo i czas jest zerojedynkowy. Albo Polska będzie, albo Polski nie będzie. Dla mnie to jest jasne, że zbliża się moment, kiedy dobiegniemy do mety: albo oni wygrają ten bieg i Polski nie będzie, albo my wygramy ten bieg i Polska będzie – twierdzi poseł Marek Jakubiak pytany o kandydata PiS na premiera.

Ukrainiec wiózł plakaty propagujące nazizm. Szybka akcja Policji z ostatniej chwili
Ukrainiec wiózł plakaty propagujące nazizm. Szybka akcja Policji

Jak poinformowała na platformie X Policja Lubelska, 68- letni obywatel Ukrainy wiózł plakaty propagujące nazizm. Reakcja funkcjonariuszy była natychmiastowa.

Słupy ognia i czarny dym nad Teheranem. Atak na infrastrukturę naftową z ostatniej chwili
Słupy ognia i czarny dym nad Teheranem. Atak na infrastrukturę naftową

Ciemny dym spowił niebo nad Teheranem po niedzielnych amerykańsko-izraelskich atakach na infrastrukturę naftową w stolicy Iranu – podał portal BBC. Jak donoszą agencje Reutera i AFP, po południu ponownie było słychać silne wybuchy w mieście.

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane