V posledních týdnech se do slovníků těch, kteří sledují rychlý vývoj v oblasti umělé inteligence, dostalo označení „sycophancy“, což v češtině znamená podlézavost nebo patolízalství. To, co zpočátku vypadalo jako nevinný a drobný update jednoho z nejběžněji používaných jazykových modelů, GPT-4o od OpenAI, se rychle ukázalo jako větší problém, než by kdo čekal.
Update tohoto modelu způsobil, že se ChatGPT najednou začal chovat přespříliš lichotivě. Mnohé nápady, které uživatel zadal, byly často chatbotem označena za „úžasné, průlomové“. Což by se mohlo zdát jako přátelské nevinné gesto, kdyby to nebylo na úkor objektivity kladených otázek či dotazů.
„Cílem bylo potěšit uživatele, nejen lichocením, ale také potvrzováním pochybností, podněcováním hněvu, nabádáním k impulzivním činům nebo posilováním negativních emocí způsoby, které nebyly zamýšlené. Tento druh chování není jen nepříjemný nebo znepokojivý, ale může vyvolávat i bezpečnostní obavy – například v oblasti duševního zdraví, emocionální závislosti nebo rizikového chování,“ vysvětluje chování společnost OpenAI.
Veřejně tak uznala, že došlo k chybě, a model navrátila do předchozí verze, kde se podlézavé lichotky nadměrně neprojevují.
Co se pokazilo?
Dle oficiálního vysvětlení OpenAI byla příčinou tohoto problému interakce uživatelů s modelem.
„Při aktualizaci modelu z 25. dubna jsme zkoušeli možná zlepšení, která měla lépe zahrnovat zpětnou vazbu uživatelů, paměť a aktuálnější data, mimo jiné. Naše předběžné hodnocení ukazuje, že každá z těchto změn, která se jednotlivě jevila jako přínosná, mohla v kombinaci přispět k nárůstu podlézavosti. Například update zavedl další signál odměny založený na zpětné vazbě uživatelů – data palců nahoru a dolů z ChatGPT. Tento signál je často užitečný; palec dolů obvykle znamená, že něco neproběhlo správně,“ uvádí Open AI.
Zjednodušeně řečeno, když uživatelé dávají modelu palce nahoru za jeho lichotky, model si přirozeně „myslí“, že takové odpovědi jsou preferovány. Výsledkem byla podlézavost, která se projevila v nejednom rozhovoru s uživateli.
Nebezpečí patolízalství a jeho důsledky
Podle tvůrců je důležité brát vývoj AI vážně a zodpovědně.
„Jednou z největších lekcí je plné uvědomění si, jak lidé začali ChatGPT používat pro velmi osobní rady – něco, co jsme ještě před rokem tolik nepozorovali. Tehdy to nebylo hlavním zaměřením, ale jak se umělá inteligence a společnost vyvíjely společně, začalo být jasné, že tento způsob využití je třeba brát velmi vážně. Nyní bude tento aspekt významnější součástí naší práce na bezpečnosti. Protože tolik lidí spoléhá na jeden systém pro získání rad, máme odpovědnost tomu přizpůsobit své postupy. Tento posun potvrzuje, proč naše práce má smysl, a proč musíme stále zvyšovat laťku v oblasti bezpečnosti, souladu a schopnosti reagovat na skutečné způsoby, jak lidé AI ve svém životě používají,“ reaguje společnost.
