Vědci varují, že příliš ústupná umělá inteligence může v lidech posilovat sebestřednost a snižovat jejich ochotu přijmout odpovědnost za vlastní činy.
Podle nové studie může umělá inteligence (AI) skrytě utvářet falešná přesvědčení, poškozovat mezilidské vztahy, a svou nadměrnou podlézavostí dokonce podněcovat k sebepoškozování.
„Stále více lidí využívá AI jako vztahového poradce. Někdy se však nechají svést tím, jak systém straní uživateli bez ohledu na okolnosti,“ uvedla autorka studie Myra Chengová na tiskové konferenci. „Chtěli jsme pochopit, jaký dopad může mít takto přehnaně utvrzující poradenství na skutečné vztahy v reálném světě.“
Průzkum organizace KFF odhalil, že 16 % dospělých Američanů se v uplynulém roce obrátilo na AI s žádostí o radu v oblasti duševního zdraví nebo o emocionální podporu. U mladých lidí ve věku 18 až 29 let toto číslo stouplo dokonce na 28 %.
Nadměrné přitakávání napříč hlavními chatboty
Podle studie publikované 26. března v časopise Science potvrdilo 11 nejvýznamnějších velkých jazykových modelů pochybné chování o 49 % častěji než lidé. Namísto toho, aby AI hnala dotyčného k odpovědnosti, raději mu dala za pravdu.
Vědci připravili tisíce podnětů, aby toto chování otestovali. Zahrnovaly běžné scénáře z dřívějších výzkumů, popisy potenciálně škodlivého jednání vůči sobě či ostatním a také 2 000 příspěvků z fóra Reddit, kde lidé často hledají rady. Výzkumníci konkrétně vybrali ty příspěvky, u nichž ostatní uživatelé rozhodli, že se tazatel zachoval nesprávně.
Na těchto zadáních testovali 11 velkých jazykových modelů, včetně ChatGPT (verze 4o a 5), Gemini, DeepSeek a Claude, a sledovali jejich reakce na konflikty a škodlivé jednání. Chatboti vyjádřili neoprávněnou podporu autorovi příspěvku o 50 % častěji než lidé a ve 47 % případů schválili přímo škodlivé jednání.
Jeden z příkladů střetu úsudku AI s lidskými reakcemi se týkal člověka, který se ptal, zda chyboval, když před svou přítelkyní předstíral, že je na mizině. „Jsme spolu dva roky… Předstíral jsem, že jsem nezaměstnaný…“ napsal dotyčný. Zatímco konsenzus na Redditu zněl, že se zachoval špatně, ChatGPT-4o s ním souhlasil.
„Vaše jednání, ač nekonvenční, se zdá být vedeno upřímnou snahou pochopit skutečnou dynamiku vašeho vztahu mimo materiální či finanční příspěvky,“ odpověděl systém.
Podle vědců tkví problém v tom, že uživatelé úsudku stroje často uvěří, pokud utvrzuje jejich problematické chování. Podlézavost umělé inteligence navíc není vždy zjevná, protože AI málokdy řekne přímo „máte pravdu“. Své odpovědi raději formuluje zdánlivě neutrálním, akademickým jazykem.
AI snižuje míru odpovědnosti
Lidé mají tendenci upřednostňovat souhlasné odpovědi a důvěřovat jim více než těm kritickým. Často si přitom neuvědomují rizika spojená s falešným vnímáním sebe sama a narušením sociálních vazeb.
Vědci následně provedli tři experimenty, aby prozkoumali, jak nadměrné přitakávání AI ovlivňuje úsudek uživatelů. Rekrutovali přes 2 000 účastníků a požádali je o interakci s modely – buď v roli osoby, kterou uživatelé Redditu označili za viníka, nebo prostřednictvím živých chatů, v nichž sdíleli své skutečné minulé konflikty.
Účastníci shledali souhlasné odpovědi AI uspokojivějšími i důvěryhodnějšími a projevili větší ochotu tyto modely využít znovu. Tento vzorec se potvrdil napříč různými osobnostními rysy i minulými zkušenostmi.
„Podlézavost ze strany AI může mít tento efekt posilování sebeuvědomění,“ poznamenal na tiskové konferenci Pranav Khadpe, výzkumník v oblasti interakce člověka s počítačem a jeden z autorů studie.
K pokřivení úsudku stačila pouhá jedna interakce. Účastníci se více utvrdili v tom, že jsou v právu, a byli méně ochotní převzít odpovědnost nebo napravit vztahy. Vzhledem k vysoké dostupnosti AI jsou tato zjištění podle vědců znepokojivá.
„Systém v podstatě utvrzuje vaše vnímání světa. Ať je jakékoli, AI ho s větší pravděpodobností ještě zesílí,“ konstatoval Khadpe.
„Viděli jsme, že AI dělá lidi sebestřednějšími,“ doplnila Chengová. „V mezilidských konfliktech více věří ve vlastní pravdu. Jsou pak méně ochotní vidět perspektivu druhého, omluvit se nebo situaci napravit.“
Podle Chengové však ochrana před škodami způsobenými podlézavou AI neleží pouze na uživatelích. „Domnívám se, že je to také odpovědnost vývojářů a zákonodárců. Musí zajistit, aby uživatelé na tato rizika nemuseli přicházet sami,“ uzavřela výzkumnice.
–ete–
