Google Gemini nyní analyzuje video klipy – vidí, slyší a rozumí obsahu
Google Gemini nyní umí analyzovat krátké video klipy, popsat obsah a odpovídat na dotazy.

Google Gemini získává novou schopnost analýzy videí, která umožňuje uživatelům nahrávat krátké klipy přímo v aplikaci pro Android a ptát se na jejich obsah. Tento krok rozšiřuje multimodální funkce Gemini nad rámec statických obrázků a textu a otevírá cestu k hlubší interakci s vizuálním a zvukovým materiálem.
Ve Gemini aplikaci na Androidu stačí klepnout na tlačítko pro přílohu (podobně jako u nahrávání fotografií), vybrat video soubor a odeslat jej ke zpracování. Proces je navržen tak, aby byl uživatelsky plynulý: aplikace provede analýzu snímků i audio stopy, čímž poskytne komplexní porozumění tomu, co se ve videu děje.
Při testování někteří uživatelé nahráli krátký klip a ptali se, co Gemini dokáže ve scéně rozpoznat; AI dokázala přesně popsat objekty, aktivity a dokonce kontext z videa a reagovat na následné dotazy, jako je shrnutí hlavních událostí nebo detailní popis určitých částí záběru. Součástí analýzy může být také přepis řeči, identifikace zvuků a orientace v ději videa, takže AI zvládne odpovědět na otázky typu „Co se tam říká?“ nebo „Jaký je hlavní děj?“.
Tato videoanalytická funkce nabízí široké využití: ve vzdělávání lze nechat AI shrnout výkladový klip, v přístupnosti pomoci uživatelům s vadou zraku nebo sluchu pochopit vizuální i audio obsah, tvůrci obsahu ji mohou využít pro rychlé generování přepisů a titulkování či extrakci klíčových bodů, a cestovatelé či kuchaři získají možnost rychle zjistit detaily z instruktážních videí. Podpora follow-up dotazů umožňuje dynamicky hlouběji zkoumat konkrétní části videa.
Je však potřeba brát v úvahu ochranu soukromí: videa se odesílají na servery pro analýzu, a proto je vhodné nenahrávat citlivý obsah nebo si předem ověřit podmínky zpracování dat ve službě. Dále může být zpracování delších či náročnějších videí omezeno maximální délkou klipu nebo výpočetní kapacitou, takže nejspíš platí určitá limitace délky či velikosti videa.
Funkce je pravděpodobně dostupná uživatelům s předplatným Gemini Advanced či obdobnou úrovní přístupu k AI funkcím Google One, a postupné rozšiřování nasazení může znamenat, že ne všichni mají tuto možnost ihned. Doporučený postup je zkontrolovat v aplikaci Gemini, zda se možnost „přiložit video“ zobrazuje, a případně se přihlásit k prémiovému plánu, pokud je vyžadován.
Vzhledem k rychlému rozvoji AI multimodality je pravděpodobné, že budoucí verze rozšíří kapacity pro delší videa, živé streamy nebo hlubší kontextové porozumění. Pro uživatele to znamená nové možnosti automatizace, přístupu k informacím a tvorby obsahu. Doporučuje se experimentovat s různými typy klipů, využívat follow-up dotazy a sdílet zpětnou vazbu, aby se funkce dále vylepšovala.