Apple zveřejnil další podrobnosti o nové generaci svých modelů Apple Foundation Models (AFM), které pohánějí funkce Apple Intelligence. V rozhovoru vystoupili Craig Federighi, Amar Subramanya, Mike Rockwell a Sebastien Marineau-Mes.



Ti objasnili, jak byly modely vyvinuty a jakou roli v jejich vzniku sehrál Google. Craig Federighi jednoznačně odmítl spekulace, že by Apple využíval modely Gemini přímo. Podle Federighiho Apple nepoužívá žádné modely Gemini nasazené pro zákazníky Googlu, žádný klientský kód Gemini ani infrastrukturu Google Search jako základ svého systému. Amar Subramanya představil třetí generaci Apple Foundation Models, která zahrnuje pět modelů rozdělených na zařízení a cloud.

Modely běžící přímo v zařízení
  • AFM Core – nový hustý jazykový model.
  • AFM Core Advanced – pokročilý model s nativní podporou multimodálních vstupů.

Právě AFM Core Advanced umožňuje nové funkce, například přirozenější hlasové projevy nebo práci s pozvánkami, aniž by bylo nutné odesílat data do cloudu.

Cloudové modely

Zde Apple využívá tři modely:

  • AFM Cloud pro rychlé požadavky v rámci Private Cloud Compute.
  • AFM Cloud Image pro generování a úpravy obrázků, včetně prostorového překomponování fotografií.
  • AFM Cloud Pro, nejvýkonnější model určený pro složité uvažování a agentní úlohy.
Jak pomohl Google?

Nejdůležitější novinkou bylo vysvětlení spolupráce s Googlem. Subramanya uvedl, že všechny modely byly:

  • navrženy speciálně pro Apple Silicon,
  • natrénovány na proprietárních datech Applu,
  • optimalizovány
  • a následně vyladěny pomocí výstupů z nejpokročilejších modelů Gemini.

To znamená, že Apple nepřevzal samotné modely Gemini, ale využil jejich odpovědi při procesu tzv. distilace, která pomáhá menším modelům dosahovat vyšší kvality. Celou architekturu Apple Intelligence řídí tzv. System Orchestrator, který podle Federighiho představuje klíčový prvek ochrany soukromí. Ten rozhoduje, zda konkrétní požadavek zpracuje model přímo v zařízení, nebo v cloudu. Přitom bere v úvahu složitost úkolu i to, zda je potřeba pracovat s osobním kontextem uživatele.

Systém využívá:

  • App Toolbox pro práci s aplikacemi,
  • Spotlight Semantic Index pro osobní obsah,
  • kontext z obrazovky,
  • a vlastní službu World Knowledge Service pro získávání aktuálních informací.

Apple zároveň znovu zdůraznil, že infrastrukturu Private Cloud Compute mohou nezávisle ověřovat bezpečnostní výzkumníci a že ani při využití Nvidia GPU v Google Cloudu nejsou uživatelská data ukládána ani zpřístupňována třetím stranám.