Apple vytvořil nástroj, který využívá velké jazykové modely (LLM) k animaci statických obrázků na základě textových výzev uživatele. Apple popisuje inovaci v novém výzkumném dokumentu.



„Zkombinovali jsme nově vznikající principy návrhu pro jazykové výzvy s možnostmi generování kódu LLM, abychom vytvořili nový animační nástroj s umělou inteligencí nazvaný Keyframer. S Keyframerem mohou uživatelé vytvářet animované ilustrace ze statických 2D obrázků prostřednictvím textových výzev v přirozeném jazyce.“ Pro vytvoření animace uživatel nahraje obrázek SVG – řekněme vesmírné rakety – a poté zadá výzvu jako „vygeneruj tři návrhy, kde obloha zmizí do různých barev a hvězdy se třpytí“. Keyframer poté vygeneruje kód CSS pro animaci a uživatel jej může upřesnit přímou úpravou kódu nebo zadáním dalších textových výzev.

„Keyframer umožní uživatelům iterativně vylepšovat své návrhy pomocí sekvenčního dotazování, místo aby museli předem zvažovat celý návrh,“ vysvětlují autoři. „Doufáme, že touto prací inspirujeme budoucí nástroje pro návrh animací, které kombinují výkonné generativní schopnosti LLM pro urychlení prototypování návrhu.“ Podle listu byl výzkum založen na rozhovorech s profesionálními designéry a inženýry animace. „Myslím, že to bylo mnohem rychlejší než spousta věcí, které jsem kdy udělal,“ řekl jeden z účastníků studie. „Myslím, že udělat něco takového předtím by zabralo hodiny.“