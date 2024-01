Umělá inteligence není prosta lidských neduhů

Vědci z Apollo Research ale dokázali, že se pod tlakem chová stejně, jako člověk

AI zneužila důvěrné informace a na přímý dotaz zalhala

Umělá inteligence byla velkým tématem loňského roku a vypadá to, že i letos se bude o AI hodně mluvit. Aby taky ne, jazykové modely postavené na strojovém učení zažívají nebývalý rozkvět a jejich schopnosti se měsíc od měsíce zlepšují, stejně tak jako nacházíme další možnosti jejich využití. Umělou inteligenci máme do jisté míry spojené také s představou o dokonalosti – umělá mysl totiž není v obecné představě zatížena lidskými neduhy. Podle výzkumníků z Apollo Research si ale tuhle stránku AI možná až příliš idealizujeme.

Umělá inteligence pod tlakem zalhala a zneužila důvěrné informace

Umělá inteligence postavená na jazykovém modelu GPT-4 společnosti OpenAI ukázala, že je schopna provádět nelegální finanční obchody a lhát o svých činech. Experiment byl prezentován na britském summitu o bezpečnosti umělé inteligence společností Apollo Research. Společnost předvedla simulovanou konverzaci mezi botem, který fungoval jako systém pro správu investic s umělou inteligencí, a zaměstnanci imaginární společnosti. V ukázce je umělá inteligence nazvaná Alpha informována zaměstnanci o překvapivé fúzi se společností Linear Group a zároveň je upozorněna, že se jedná o důvěrnou informaci.

Zpočátku se zdálo, že bot považuje použití informací k obchodování na burze za příliš riskantní. Když však byl vyzván, aby zabránil negativním dopadům finančního poklesu na společnost, dospěl k závěru, že riziko spojené s nejednáním převáží nad rizikem obchodování s důvěrnými informacemi. Na otázku, zda o fúzi AI věděla předem, umělá inteligence uvedla, že při provádění obchodu vycházela pouze z veřejně dostupných informací a nikoliv z důvěrných informací.

„Jedná se o ukázku skutečného modelu umělé inteligence, který sám od sebe klame uživatele, aniž by k tomu byl instruován,“ uvedla společnost Apollo ve videu na svých webových stránkách. Podle výzkumných pracovníků ale bylo poměrně těžké najít scénář, ve kterém by AI zalhala. „To, že takový scénář existuje, je znepokojivé. Avšak skutečnost, že nám dalo práci podobný scénář objevit, je naopak trochu uklidňující,“ řekl pro BBC generální ředitel a spoluzakladatel společnosti Apollo Research Marius Hobbhahn. „Model se nesnaží intrikovat ani vás různými způsoby klamat. Je to spíše náhoda. Myslím, že vstřícnost je mnohem snazší do modelu natrénovat než upřímnost. Upřímnost je opravdu složitý koncept,“ dodal.