あなたはGoogleの高性能動画生成AIモデル「Veo 3」をご存知でしょうか?
今年5月のGoogle I/Oでの発表され、そのリアルな動画生成能力は圧倒的で、人物の動画は本物と見分けがつかないくらい精巧な動画を作成できるようになりました。
今回そんなVeo 3がGoogle Geminiにも新たな機能として搭載され、写真から動画を生成することが可能になったので詳しくご紹介します。
Veo3の「写真から動画生成」機能とは?
これまでのVeo 3はテキストの説明に基づいて、音声やBGM、環境音まで付加されたリアルな動画を生成することができました。その精度は非常に高く、AIが生成した動画を一目で見分けるのが困難なほどです。
しかし今回、Googleはさらに一歩進んだ「写真から動画生成」機能、通称「Image to Video」がGeminiに搭載されました。これにより写真をアップロードするだけで、その画像から動く動画を生成できるようになったのです。
この機能はこれまで映画制作者向けのAIツール「Flow」で提供されていましたが、今回からGoogle WorkspaceのGemini Proを利用している方も利用できるようになりました。
特徴
今回の画像から動画を生成する機能は以下の特徴があります。
- 8秒間の動画を作成
- 音声まで含めた動画の生成が可能
- リプシンク機能もあり
- 解像度は720p(1280x720)
- 利用できるモデルはVeo3 Fast
この機能の最大の魅力は「思い描く動画のイメージをより簡単に実現できる」点にあります。
これまでは言葉で細部まで描写する必要がありましたが、写真を添付して使うことで、より直感的に望み通りの「見た目」を持つ動画を作成できるようになります。
これまでKLINGなどの画像から動画を生成できるものもありましたが、時間が長くかかったりと個人的には満足できる制度ではありませんのでした。
Geminiでの使い方
使い方はともて簡単です。
方法
- Geminiのツールバーから「動画」を選択します。
- 画像をアップロードします。
- 動画の内容や音声に関する指示をプロンプトとして入力します。
- 数分待つと動画に変換されます。
日常の写真をアニメーション化したり、AIに生成してもらった画像をさらに動画で動かすといった使い方もできます。
生成された動画はダウンロードもできるので、SNSでシェアしたりもできます。
気になる機能制限と注意点
Geminiを使った画像から動画の生成は素晴らしいのですが、いくつか利用上の制限がありますのでご注意ください。
プロンプトの入力
日本語でプロンプトを入力することも可能ですが、動画が無音になったりと挙動が不安定な場合があるようです。
プロンプト入力の際は、日本語を英語に翻訳してから、英語でプロンプトを入力するようにした方が安定した動作が期待できます。
著作権と商用利用
画像から動画を生成することができるため、使用する画像によっては注意が必要となります。
また動画の商用利用などについても、Googleが提供する利用規約やAIサービスのポリシーを必ず確認することが重要です。
まとめ
Google Geminiの「写真から動画生成」機能は、まさに未来を感じさせる画期的なアップデートです。
音声やリップシンクにも対応し、直感的に動画制作が可能になっていますので、プロンプト入力と英著作権や商用利用に注意して、まずは実際に性能をチェックしてもらえればと思います。
Google WorkspaceのGemini Proで利用できるのも魅力です。Google AI Proよりも安く加入できてGemini Proが利用できます。Google Workspaceについてはこちらの記事で詳しく解説しています。
-
-
参考Google Workspaceは無料で使うべき?有料版の「Starter」「Standard」の2つのプラン比較
フリーランスや個人事業主の方なら、一度は「無料のGoogleアカウントがあるのに、わざわざ有料のGoogle Workspaceにお金を払う必要があるの?」と疑問に思ったことがあるでしょう。 &nbs ...
続きを見る
今なら年間10%offのクーポンコードも配布しておりますので、気になる方は下記からクーポンコードをお申し込みください。