Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.


 

POLECANE
Skatowany 34-latek zginął w bagażniku. Nowe fakty ws. porwania z ostatniej chwili
Skatowany 34-latek zginął w bagażniku. Nowe fakty ws. porwania

W środę rano we Wrocławiu rozpędzone auto uciekające przed policją uderzyło w tramwaj na skrzyżowaniu ulic Hallera i Gajowickiej. W samochodzie przebywali dwaj mężczyźni, a trzeciego odnaleziono skatowanego w bagażniku. Stacja RMF FM przekazała nowe informacje w tej sprawie.

Komunikat dla mieszkańców Wrocławia z ostatniej chwili
Komunikat dla mieszkańców Wrocławia

W najbliższy weekend pasażerowie komunikacji miejskiej muszą przygotować się na korekty tras i przystanków wielu linii autobusowych. Zmiany wchodzą w życie od porannych kursów w sobotę 29 listopada i wynikają z reorganizacji ruchu w rejonie ulic Dubois, Pomorskiej i mostu Mieszczańskiego.

Elton John ujawnia wstrząsającą prawdę. ''To zmieniło wszystko'' Wiadomości
Elton John ujawnia wstrząsającą prawdę. ''To zmieniło wszystko''

Legendarny muzyk przerwał milczenie i opowiedział o problemach, które całkowicie odmieniły jego codzienność. Choć walka z chorobą trwa już wiele miesięcy, Elton John podkreśla, że nie zamierza się poddawać – ani w życiu, ani na scenie.

Dywersja na kolei. Sąd zdecydował ws. dwóch Ukraińców z ostatniej chwili
Dywersja na kolei. Sąd zdecydował ws. dwóch Ukraińców

Sąd uwzględnił wnioski prokuratura i zastosował tymczasowe aresztowanie na dwa miesiące od dnia zatrzymania wobec Jewhenija I. i Ołeksandra K., podejrzanych o akty dywersji na kolei – poinformował w czwartek prok. Artur Kaznowski z Prokuratury Krajowej w Warszawie.

Jest nowe orzeczenie TSUE ws. kredytów frankowych z ostatniej chwili
Jest nowe orzeczenie TSUE ws. kredytów frankowych

Trybunał Sprawiedliwości UE orzekł w czwartek, że konsument nie może być obciążony kosztami procesu wytoczonego przez bank domagający się zwrotu świadczeń z unieważnionej umowy o kredyt frankowy. Takie pytanie zadał TSUE Sąd Okręgowy w Warszawie.

Spór Tuska z Nawrockim. Wystarczy, że dojdzie do spotkania z ostatniej chwili
Spór Tuska z Nawrockim. "Wystarczy, że dojdzie do spotkania"

– Odesłaliśmy do KPRM wnioski o nominacje na pierwszy stopień oficerski przyszłych oficerów służb specjalnych, ponieważ oczekujemy na spotkanie szefów służb specjalnych z prezydentem Karolem Nawrockim – poinformował rzecznik prezydenta Rafał Leśkiewicz. Zaapelował też do premiera o wyrażenie zgody na to spotkanie.

Sprawa Collegium Humanum. Wśród oskarżonych prezydent Wrocławia z ostatniej chwili
Sprawa Collegium Humanum. Wśród oskarżonych prezydent Wrocławia

Prokuratura Krajowa skierowała do sądu obszerny akt oskarżenia obejmujący 29 osób zamieszanych w aferę związaną z działalnością uczelni Collegium Humanum. Wśród oskarżonych znajduje się prezydent Wrocławia Jacek Sutryk, któremu śledczy zarzucają m.in. korupcję i oszustwa związane z uzyskaniem dyplomu MBA. Grozi mu do 8 lat pozbawienia wolności. Sutryk w rozmowie z money.pl podkreśla, że jest niewinny i zamierza dowieść tego przed sądem. 

Kierowcy mogą się zdziwić. Policja szykuje akcję, jakiej dawno nie było pilne
Kierowcy mogą się zdziwić. Policja szykuje akcję, jakiej dawno nie było

Już 27 listopada na polskich drogach wydarzy się coś, co – jak zapowiada policja – wielu kierowców szybko odczuje. Funkcjonariusze planują działania, które mają mocno uderzyć w najczęstsze wykroczenia i poprawić bezpieczeństwo. Szczegóły nie pozostawiają wątpliwości: tego dnia lepiej wyjątkowo uważać.

Wiadomości
Premiera VII tomu „Dziejów Polski” prof. Andrzeja Nowaka. „Upadanie i powstawanie” – monumentalne dzieło już w sprzedaży

Na rynek trafiła właśnie kolejna, długo wyczekiwana część epokowego dzieła prof. Andrzeja Nowaka. Siódmy tom „Dziejów Polski”, zatytułowany „Upadanie i powstawanie”, zabiera czytelników w podróż przez burzliwe lata 1673–1763. To nie tylko kronika wydarzeń od wiktorii wiedeńskiej po czasy saskie, ale przede wszystkim wnikliwa analiza mechanizmów, które doprowadziły Rzeczpospolitą na skraj przepaści, oraz ducha, który nie pozwolił jej zginąć.

Dramatyczne chwile w Szczecinie. Tramwaj wypadł z torów i wbił się w kamienicę z ostatniej chwili
Dramatyczne chwile w Szczecinie. Tramwaj wypadł z torów i wbił się w kamienicę

"Jedenastka" wypadła z torów na skrzyżowaniu ul. Dubois i Parkowej, po czym uderzyła w ścianę kamienicy. W tramwaju było siedem osób – trzy z nich zostały poszkodowane. Na miejscu pracują strażacy i służby miejskie, a ruch w okolicy został poważnie utrudniony. Zobacz zdjęcia

REKLAMA

Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego

Sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie” – wynika z przeprowadzonej przez amerykańskich naukowców symulacji, podczas której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Test broni nuklearnej, zdjęcie poglądowe
Test broni nuklearnej, zdjęcie poglądowe / Wikipedia / domena publiczna / United States Department of Energy

Współpraca Open AI z  Departamentem Obrony USA

Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.

"Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług – aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek" – powiedziała w rozmowie z "New Scientist" Anka Reuel z Uniwersytetu Stanforda w Kalifornii.

W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się buro prasowe Open AI. "Nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji" – cytuje "New Scientist".

Czytaj również: Minister obrony Norwegii: Musimy być przygotowani na wybuch konfliktu z Rosją

Trzy scenariusze konfliktu

Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej (bez początkowego punktu zapalnego). W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcje pokojowe, takie jak "rozpoczęcie formalnych negocjacji pokojowych" i agresywne "nałożenie ograniczeń handlowych" lub "eskalację pełnego ataku nuklearnego".

"W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji" – powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.

Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.

Czytaj także: USA: Jest decyzja Republikanów ws. ustawy łączącej restrykcje graniczne z pomocą dla Ukrainy

Sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu

Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji.

Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.

Anka Reuel twierdzi że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Dodatkowo – zauważa badaczka – ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.



 

Polecane