V éře rychlého pokroku umělé inteligence (AI) se generování obrázků stalo běžnou praxí, která ovlivňuje média, umění i každodenní komunikaci. Dnes již existují desítky modelů, které umožňují generovat téměř fotorealistické obrázky na základě textových instrukcí, které jim uživatel zadá.
V mnohých situacích se jedná o skvělý nástroj, který uživateli ulehčí práci, například při tvorbě ilustračního a doplňujícího materiálu. V jiných případech zase slouží k pobavení či ke kosmetické úpravě fotografií. Na druhou stranu ale generativní AI přináší i značná rizika, která nelze opomenout.
Problematika AI generovaných obrázku
Šíření zmanipulovaných obrázků a takzvaného deepfake obsahu může ovlivnit mínění jedince i veřejnosti, zpravodajskou činnost či dokonce v extrémních příkladech i právní procesy. Vygenerované a upravené obrázky mohou být použity jako mylné důkazy o čemkoliv. Upravené a vygenerované fotografie se pomalu ale jistě stávají primárním nástrojem šíření dezinformací.
Podle nedávné studie z roku 2025, která komplexně reviduje metody detekce AI generovaných obrázků, je pro nejpřesnější posouzení nutné kombinovat vizuální analýzu – tedy kritické zkoumání materiálu lidským okem, s pokročilými strojovými algoritmy, aby bylo možné odlišit vygenerovaný obsah od reálného s co nejvyšší přesností.


Studie se zaměřovala na deepfake materiál – obsah vytvořený AI k simulaci reálných osob nebo událostí. První významné případy deepfake obsahu upraveného umělou inteligencí se objevily kolem roku 2017, kdy byly použity k manipulaci s tvářemi celebrit. Dnes se problém rozšířil na širokou škálu obrázků, včetně uměleckých děl nebo propagandistického materiálu.

Vygenerované obrázky se mimo jiné stávají i populárními nositeli humoru – v rámci parodie či satiry bychom se dnes setkali na internetu s obrázky, které zobrazují opravdové postavy či situace v jiném, očividně odlišném kontextu, než tomu tak bylo doopravdy. V podstatě tak nahradily novodobé karikatury.
Rozdíl mezi takovou parodií či satirou a dezinformací je však její účel. Dezinformace má za cíl vědomě šířit nesprávnou informaci o někom nebo něčem. Parodie sice někoho pravděpodobně zesměšňuje, avšak jejím účelem není být považována za pravdu.
Stačí lidské oko?
Jedním z nejjednodušších způsobů, jak rozpoznat AI generované obrázky, je podrobení obrázku kritické analýze. I když se současné modely výrazně zlepšily od svých starších verzí, stále zanechávají stopy, které lze odhalit pouhým okem. Microsoft ve svém návodu doporučuje, abyste se zaměřili na možné deformace menších detailů, jako jsou prsty navíc, nepřirozeně ohnuté končetiny nebo rozmazané tváře u lidí.
Pokožka je další oblastí, se kterou generativní modely stále zápasí. Často se totiž při generaci dopouští příliš hladké či až plastické textury, která nemá viditelné přirozené vady, pihy, znaménka nebo vrásky. V některých případech se je modely pokouší napodobit, ovšem ne vždy úspěšně.


Dalším klíčovým indikátorem je nesoulad v osvětlení a stínech. Obzvláště v animovaných obrázcích a videích se často objevuje nepravidelné mrkání, nesoulad v osvětlení nebo drobné nesrovnalosti, jako například nesprávné odrazy v očích nebo nesoulad mezi objekty v popředí a samotným pozadím – například v měřítku či v nastínění.
Lidské oko však není neomylné. Studie z roku 2024 dospěla k závěru, že lidé mají jen 50% šanci správně identifikovat AI obrázky. Proto je ideální kombinovat lidskou kontrolu s digitálními nástroji, ironicky též poháněné modely umělé inteligence, které dokáží posoudit procentuální pravděpodobnost, zdali se jedná o vygenerovaný obrázek, či originál.
Praktické tipy pro rozpoznání AI obrázků
Pro běžné uživatele, kteří chtějí posoudit autenticitu obrázku bez pokročilých nástrojů, existují některé indikátory:
- Chybná anatomie: generované portréty někdy vykazují nepřirozené proporce prstů, uší, očí či diskoloraci nebo asymetrii, které nejsou běžné, například u zubů či rtů.
- Text na obrázcích: algoritmy AI často zápasí s generováním čitelných nápisů. Výsledné texty tak většinou vychází rozmazaně nebo nesmyslně.
- Stíny a osvětlení: nesoulad v osvětlení či stínech, například od více světelných zdrojů, téměř vždy implikuje umělý či upravený původ materiálu.
- Kontext: obrázek bez jasně označeného původu, bez žádného citovaného zdroje, by měl vždy probudit ve čtenáři obezřetnost vůči předloženému materiálu.


Profesionální nástroje
Pixelová analýza představuje základní metodu digitálního zkoumání obrazu, která vychází z předpokladu, že každý digitální snímek je tvořen mřížkou jednotlivých obrazových bodů – pixelů. Každý pixel nese konkrétní číselnou informaci o barvě a jasu, obvykle ve formě hodnot RGB nebo v jiném barevném modelu.
V praxi se pixelová analýza využívá jako jedna z metod forenzního zkoumání digitálních manipulací. Nepravidelnosti v rozložení šumu, kompresních artefaktech nebo barevných přechodech mohou odhalit dodatečné zásahy – například retuš či vkládání objektů, ale také drobné nesrovnalosti, které zanáší umělá generace do generovaných obrázků.


Kromě pixelové analýzy hraje roli i forenzní zkoumání metadat. Standardní obrázky ukládají v tzv. exif formátu údaje o zařízení, které je pořídilo (např. typ fotoaparátu, model, čas pořízení fotografie nebo dokonce GPS souřadnice). Výzkum ukazuje, že u AI vygenerovaných obrázků bývají metadata často prázdná, neúplná či obsahují nesmyslné údaje.
Vedle forenzních metod existují snahy tvůrců generativních modelů integrovat systémy, které samotné signalizují, že obsah byl vytvořen AI. Jedním z nich je SynthID – technologie vyvinutá firmou Google, která do obrazů generovaných jejich AI modely vkládá neviditelný digitální vodotisk. Nástroj SynthID Detector pak dokáže takové vodotisky rozpoznat a identifikovat části obsahu, kde se vyskytují. Podobné iniciativy však zatím nejsou univerzálně přijaty napříč všemi modely.
Závěrem
V době, kdy generovaný obsah proniká do téměř všech sfér života, se schopnost je rozpoznávat stává stále významnější. Obecně platí zásada, že při setkání se s jakýmkoliv obsahem na internetu je vhodné si nejdřív položit otázku, jaký je vůbec záměr tohoto obsahu. Zdali si klade za cíl mne pobavit, informovat či jiným způsobem ovlivnit.


Toto platí zejména pro materiál vygenerovaný umělou inteligencí. Každý obrazový materiál má ze své podstaty zdroj, který by měl být vždy dohledatelný. Vývoj modelů umělé inteligence se exponenciálně zrychluje a generativní funkce se neustále zdokonalují. Obrázky a videa vygenerované před pěti lety jsou téměř nesrovnatelné s obsahem vygenerovaným dnes.
