MacWhisper je velmi užitečný nástroj pro rychlý přepis mluveného zvuku na Macu. Dnes byla vydána verze 8 s novými funkcemi v oblasti videa, rychlosti, umělé inteligence a dalších.



Video

Nový video přehrávač je hlavní funkcí MacWhisper 8. To výrazně zlepšuje zážitek při přepisu zvuku z video souborů. Přepsaný zvuk se zobrazí jako titulky a přeložený text se zobrazí jako samostatné titulky. Přehrávač videa se ve výchozím nastavení zobrazuje jako vložený, nebo jej můžete volitelně změnit na samostatné okno. Když už mluvíme o videu, MacWhisper 8 také přináší vylepšení na YouTube. Stažené video lze přehrávat v minipřehrávači, stahování může mít vysokou nebo nízkou kvalitu a stahování z YouTube je obecně rychlejší. Můžete si také vybrat mezi stahováním videa nebo pouze zvuku z YouTube.

WhisperKit

MacWhisper 8 také zavádí podporu WhisperKit. WhisperKit je engine, který poskytuje rozpoznávání řeči v reálném čase na zařízení s čipem Apple Silicon. Modely WhisperKit využívají hardwarovou akceleraci včetně Neural Engine a Apple CoreML framework, díky čemuž jsou obzvláště efektivní. Modely WhisperKit lze přidat do seznamu v Nastavení > Pokročilé > Zobrazit modely WhisperKit.

AI a vylepšení

A konečně, MacWhisper 8 zavádí podporu pro nejnovější modely ChatGPT od OpenAI. To zahrnuje GPT-4 Turbo a nově uvedený GPT-4o, který měl premiéru před týdnem. Mezitím MacWhisper obsahuje řadu obecných vylepšení, která si můžete přečíst níže:

  • Pokud máte nastavený limit počtu znaků, aplikace neořízne slovo uprostřed.
  • Nová ikona na panelu nabídek
  • Výběr kvality a jazyka se přesunul na panel nástrojů. Pokud nejsou vidět, rozbalte okno.
  • Otevírání souborů .whisper je nyní možné při načítání modelů.
  • Aktualizováno na nejnovější engine Whisper C++, nyní s Flash Attention (aktivovat v Nastavení > Pokročilé).
  • Přepracovaná obrazovka Správa modelů pro snadnější výběr modelu.
  • „Virtuální mikrofon MS Teams“ je vyloučen z možností mikrofonu, protože se nejedná o skutečný mikrofon.
  • Opravena chyba, kdy se nezobrazovaly neplatné licenční chybové kódy.
  • Vyřešeno selhání, když neprofesionální uživatelé přidali více než dva reproduktory.
  • Klávesa Esc nezavírá obrazovky během aktivních procesů, jako je nahrávání nebo hromadný přepis.
  • Funkce Cloud Transscription nyní uvádí pouze podporované jazyky (57) ve srovnání se 100, které jsou podporovány lokálně.
  • Modifikátory klávesových zkratek se nyní zobrazují v uživatelském rozhraní (⌘+R atd.).
  • Vylepšený design tlačítek.