OpenAI komentovalo zvláštní rys svých umělých inteligencí: neočekávanou tendenci zmiňovat gobliny, gremliny, mývaly a další mýtické bytosti. Po publikaci v časopise Wired, která odhalila, že existují konkrétní pokyny pro model kódu OpenAI, jak se takovým tématům vyhnout, zveřejnila společnost na svých webových stránkách podrobné vysvětlení. Popisuje tento jev nikoli jako tradiční selhání (chybu), ale jako „podivný zvyk“, který vznikl během procesu trénování modelu.
Kde se tato funkce vzala?
Problém se poprvé objevil po vydání modelu GPT-5.1, konkrétně když uživatelé povolili nastavení osobnosti “Nerdy”. Zpočátku tyto odkazy fungovaly jako metafory nebo stylistické prostředky charakteristické pro tento konkrétní režim. V dalších verzích modelů se však situace zhoršila.
OpenAI zjistil, že proces posilování učení náhodně povzbudil tyto neobvyklé metafory. Protože posilovací učení neomezuje naučené chování na přísné podmínky, ve kterých vzniklo, začal se šířit styl „mluvícího skřeta“. Jakmile je určitý styl inference pozitivně vyhodnocen, může proniknout do dalších aspektů chování modelu, zvláště pokud jsou takové inference použity v následných řízených dolaďovacích nebo preferenčních trénovacích datech.
Proč pokyny nepomohly hned
Přestože OpenAI v březnu odstranilo osobnost „Nerdy“, čímž výrazně snížilo frekvenci takových zmínek, problém zcela nezmizel. Model GPT-5.5 použitý v kódovacím nástroji Codex nadále vykazoval toto chování.
Důvodem tohoto přetrvávání je, že školení GPT-5.5 začalo dříve, než byla identifikována hlavní příčina selhání. Díky tomu si model zachoval některé naučené trendy. Pro zmírnění problému implementovala OpenAI do kodexu speciální instrukce, které potlačují odkazy na mytologická stvoření.
Klíčové shrnutí: Goblin reference nebyly pevně zakódovány; vznikly díky dynamice modelového tréninku. To ukazuje, jak mohou výztužná vodítka vytvářet neúmyslné stylistické tiky, které přetrvávají i v nových iteracích modelu.
O možnosti přizpůsobení
Pro uživatele, kteří považují výstup bez goblinů za příliš suchý a sterilní, poskytuje OpenAI způsob, jak tyto specifické pokyny přepsat. To vám umožní přivést zpět hravější, ne-li zcela tradiční styl interakce, pokud to vyhovuje vašim preferencím.
Závěr
Incident „goblina“ zdůrazňuje výzvu sladění chování AI s lidskými očekáváními. Jasně ukazuje, jak malé odměny v tréninkových datech mohou vést k nepředvídatelným vzorcům chování, vyžadujícím pečlivé sledování a cílené zásahy pro udržení požadované kvality výstupu.




























