Google Gemini oživuje fotky pomocí Veo 3 – vytvořte video z fotografie za pár sekund

Proměňte fotku na video se zvukem v Google Gemini pomocí modelu Veo 3.

V dnešní době, kdy umělá inteligence (AI) přetváří kreativní svět, přichází Google s inovativní funkcí, která dokáže přeměnit fotografie na živá videa. Díky modelu Veo 3, integrovanému v aplikaci Gemini, můžete nyní proměnit statické obrázky v dynamické osmikosekundové videoklipy se zvukem – a to v pohodlí vlastní aplikace.

Funguje to takto: uživatel nahraje fotografii, poté ve Gemini popíše, co by se mělo ve videu dít – například „odlet motýla ze sluneční louky“ – a model vytvoří krátké video, ve kterém se dění animuje, kamera se může plynule hýbat, a dokonce se přidá originální zvuk odpovídající scéně, například šustění křídel nebo jemný vítr.

Tato funkce už je dostupná pro předplatitele služeb Google AI Pro a Ultra, a to v mnoha zemích světa včetně Evropy. Video vždy obsahuje viditelnou vodoznakovou značku, která upozorňuje, že bylo vygenerováno umělou inteligencí. Navíc je přidán neviditelný digitální otisk (SynthID), který pomáhá s ochranou a sledováním publisher-ů.

Za posledních sedm týdnů už komunita generovala více než 40 milionů videí pouze ve vybraných aplikacích Gemini a Flow – což jasně dokládá obrovskou oblibu této novinky. Lidé oživují svoje kresby, staré fotografie, reklamní plakáty i přírodní scenérie a dělají z nich malé filmové příběhy.

Model Veo 3 navíc nabízí nejenom funkci přeměny obrazu na video, ale i vylepšenou přesnost zadaných pokynů, věrnost zpracování scén, podporu různých poměrů stran (například 16:9 i vertikální 9:16) a výstup v 720p nebo 1080p kvalitě. K tomu přidává nativní generování zvuku – tedy scénické efekty, ambientní zvuky i dialogy přidané přímo podle popisu. Model je dostupný také vývojářům prostřednictvím API, a to ve variantách Veo 3 i rychlejší/stále levnější verzi Veo 3 Fast.

Díky tomu mohou vývojáři vytvářet aplikace, které automaticky generují reklamní klipy, prototypy, nebo obsah pro sociální sítě, bez nutnosti ručního střihu. Rozhraní API umožňuje jednoduše kombinovat obrázek s textovým promptem, nastavit styl videa, efekty a ihned získat profesionálně vypadající video se zvukem.

Celkově lze říct, že Google díky Veo 3 výrazně posouvá hranice kreativní AI: ze statických snímků tvořivě generuje krátké klipy, které působí naturálně, zvukově i pohybově autenticky. A co je skvělé – tato technologie je už nyní dostupná běžným uživatelům i vývojářům.