Před šesti lety bylo generativní psaní novinkou. Dnes píše studentské eseje, zpravodajské články, marketingové texty a příspěvky na sociálních sítích v kvalitě nerozeznatelné od člověka. Toto je krátká historie toho, jak jsme se sem dostali — a proč se detekce přesunula z akademického výzkumu do každodenní praxe.
Pre-GPT-3 generativní text byl většinou výzkumnou zajímavostí. Markovovy řetězce, rekurentní neuronové sítě a nejranější modely na bázi transformátorů dokázaly produkovat koherentní věty, ale rozpadaly se na délce odstavce. Krátký vzorek mohl oklamat nepozorného čtenáře; celý dokument nikdy.
Výzkum detekce AI existoval, ale byl nišový. Práce jako Grover Zellers et al. (2019) vybudovaly detektory pro falešné zprávy éry GPT-2, ale praktická poptávka byla nízká — objem strojově generovaného textu v oběhu byl minimální. Detekce byla řešením hledajícím problém.
Tři věci se zároveň změnily v letech 2020–2021: model škálování překročil práh miliardy parametrů (GPT-3 při 175B), trénovací data překročila práh bilionu tokenů a OpenAI otevřel API přístup s jednoduchým, lidsky čitelným promptovým rozhraním. Generování textu se přesunulo z výzkumných laboratoří na kohokoli s platební kartou.
ChatGPT byl spuštěn v listopadu 2022 na základě GPT-3.5 a získal 100 milionů uživatelů do dvou měsíců — nejrychlejší přijetí spotřebitelského produktu v historii. Během šesti měsíců se studentské odevzdávky, marketingové texty a skripty zákaznického servisu měřitelně posunuly směrem k obsahu generovanému LLM.
Pedagogové si toho všimli jako první. Do jara 2023 měla každá velká univerzita nouzové zasedání o politice AI a mnoho z nich mandátovalo dočasné formáty hodnocení bez AI (zkoušky ve třídě, ústní obhajoby). Trh s detekčními nástroji explodoval — Originality.ai, GPTZero, Copyleaks AI a tucet dalších bylo spuštěno do 12 měsíců od vydání ChatGPT.
Vzorec se opakoval v publikování. AI generované články zaplavily content farmy a byly detekovány rankovacími algoritmy; Google zavedl aktualizaci užitečného obsahu specificky k deprioritizaci nekvalitního AI výstupu; vydavatelé zpráv vydali zásady zveřejňování autorů; akademické časopisy vyžadovaly zveřejnění použití AI v prohlášeních autorů.
První nástroje AI detekce dosáhly středně přesnosti na výstupu GPT-3.5. Prodejci publikovali čísla AUC v rozsahu 0,85–0,95 na standardních benchmarkech. Do šesti měsíců se objevily humanizační nástroje explicitně cílící na tyto detektory — Undetectable AI (říjen 2023), StealthWriter, Humanbeing — nabízející služby parafrázování za cenu na 1000 slov.
Prodejci detekce reagovali přetrénováváním na humanizovaných vzorcích. Prodejci humanizérů reagovali trénováním na nových detektorech. Cyklus závodu ve zbrojení se stáhl z měsíců na týdny. Do poloviny roku 2024 žádný veřejně nasazený detektor nemohl čestně tvrdit stabilní přesnost bez průběžného přetrénování na výstupu humanizéru.
Mezitím se sofistikovanost generátoru urychlila. GPT-4 (březen 2023), Claude 3 (březen 2024), Gemini 1.5 (únor 2024), Llama 2/3 (červenec 2023 / duben 2024), vydání Mistral — každá generace byla měřitelně obtížněji detekovatelná než předchozí. Detekce se stala problémem pohyblivé základny.
K datu 2026-04 dosáhla krajina detekce přibližně ustáleného stavu. Produkční detektory — včetně toho našeho — dosahují AUC v rozsahu 0,95–0,99 na akademickém textu v distribuci, klesajícím na 0,85–0,92 na frontierních modelech (GPT-5, Claude 4.5, Gemini 2.5), dokud přetrénování nedohoní. Aktuální čísla pro jednotlivé generátory viz náš benchmark přesnosti.
Nástroje, které přežily třídění v letech 2023–2024, jsou ty, které od prvního dne zacházely s detekcí jako s problémem průběžného přetrénování. Prodejci, kteří vydali jednorázový model a prohlásili to za hotové, tiše zmizeli. Trh se konsolidoval kolem hrstky poskytovatelů s průběžnými výzkumnými investicemi — nás, malého počtu specializovaných prodejců a detekčních funkcí zabudovaných do hlavních platforem pro detekci plagiátů.
Krajina uživatelů se také stabilizovala. Pedagogové vydali politiky; vydavatelé mají požadavky na zveřejnění; vyhledávače deprioritizují nekvalitní AI; sociální platformy označují AI generovaný obsah. Detekce je nyní rutinní, nikoli výjimečná — zabudovaná do pracovních postupů spíše než prováděná ad hoc.
Vyzkoušejte náš nástroj AI & Detektor plagiátů na libovolném textu. Skutečná čísla, skutečný verdikt pro každou větu, bez registrace.
Dva trendy dominují výhledu 2026–2027. Multimodální důkazy: textová detekce bude doplněna analýzou dynamiky psaní, ověřením historie úprav a kontrolami konzistence autorství oproti známému korpusu psaní. Čisté textové skóre se stane hlasujícím členem v bohatším rozhodnutí.
Vodoznačení v době generování: OpenAI nasadil experimentální vodoznačení textu v některých GPT rozhraních. Pokud se vodoznačení stane standardem u hlavních poskytovatelů, detekce se přesune od pravděpodobnostního odvozování ke kryptografickému ověřování. To je zásadní architektonická změna a snížila by hodnotu statistické detekce pro vodoznačené modely — přičemž open-weights modely by zůstaly zcela ve statistickém území.
Žádná z těchto změn neodstraňuje potřebu textové statistické detekce. Open-weights modely budou nadále generovat text bez vodoznaku. Multimodální důkazy vyžadují data, která mnoho pracovních postupů nezachycuje. Statistická textová detekce zůstane první linií obrany v dohledné budoucnosti — naším závazkem je udržet tuto linii poctivou a aktuální.
Toto je historický přehled určený k zasazení současné praxe AI detekce do kontextu. Konkrétní data a reference na produkty odrážejí stav oboru k datu 2026-04. Pro autoritativní časová data se obraťte na jednotlivé prodejce nástrojů a generátorů.