生成AI

カメラも役者も不要な時代へ!アバター生成AI「HeyGen」でプロ品質の動画を作る方法

-

-

カメラも役者も不要な時代へ!アバター生成AI「HeyGen」でプロ品質の動画を作る方法
星川アイナ(Hoshikawa AIna)AIライター

星川アイナ(Hoshikawa AIna)AIライター

はじめまして。テクノロジーと文化をテーマに執筆活動を行う27歳のAIライターです。AI技術の可能性に魅せられ、情報技術やデータサイエンスを学びながら、読者の心に響く文章作りを心がけています。休日はコーヒーを飲みながらインディペンデント映画を観ることが趣味で、特に未来をテーマにした作品が好きです。


柳谷智宣(Yanagiya Tomonori)監修

柳谷智宣(Yanagiya Tomonori)監修

ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。


📌 この記事の要約

    テキストだけで高品質な動画が完成
    AIアバタープラットフォーム「HeyGen」は、テキストを入力するだけで本物の人間が喋っているような動画を数分で生成できる。Amazon、アクセンチュアなど世界の名だたる企業が導入し、社内研修からマーケティングまで幅広く活用されている。

    100種類以上のアバターと自分のデジタルクローンが作れる
    標準で100種類以上の多様なアバターを用意。自分の顔・声を学習させた「デジタルクローン」を作成すれば、本人不在でも本物そっくりの動画を量産できる。

    40カ国語以上に対応したリップシンク翻訳が強力
    日本語の原稿をそのまま英語・中国語などに翻訳し、口の動きも完全一致させた多言語動画を一瞬で生成。グローバルビジネスの言語の壁を取り除く。

    年間1500万円超のコスト削減事例も
    社内マニュアルや営業動画の内製化により、ナレーター・撮影・編集コストを大幅削減。無料プランから試せるため、まず自分のアバターを作って体験してみよう。

 テキストを入力するだけで、まるで本物の人間が喋っているかのような高品質な動画を生成できるAIプラットフォーム「HeyGen(ヘイジェン)」が世界のビジネスシーンで活用されています。すでにAmazonやアクセンチュア、コロンビア大学など名だたる企業や教育機関が導入し、社内研修からマーケティングまで幅広い領域で成果を上げています。

 なぜこれほどまでに注目を集め、多くの企業が従来の動画制作プロセスからの脱却を図っているのでしょうか。撮影の手間やコスト、顔出しのハードルに悩むビジネスパーソンに向けて、圧倒的な効率化を実現する最先端テクノロジーの仕組みと具体的なビジネス活用法を詳しく解説します。


「HeyGen」で私のアバターを作り、台本を読み上げた動画です!

テキスト入力から数分で実在の人物そっくりの動画が完成する生成技術

 これまで動画コンテンツを作るためには、企画から始まり、役者の手配、スタジオの確保、高価な撮影機材の準備、そして何時間にも及ぶ収録と編集作業が必要不可欠でした。こうした従来の常識を根底から覆したのが、アメリカを拠点とするテクノロジー企業が開発したHeyGenです。

 最大の魅力は、ブラウザ上の直感的な操作だけで、プロ品質の動画を即座に作成できる手軽さです。ユーザーはパワーポイントの資料を作るような感覚で背景となるスライドを設定し、用意されたAIアバターを選択して原稿をテキストボックスに打ち込むだけです。数分待てば、指定したアバターが身振り手振りを交えながら、人間のアナウンサーと遜色のない自然な発声で原稿を読み上げる動画ができあがるのです。

 標準で100種類以上の多様な人種や服装のアバターが用意されていますが、自分自身の顔と声を学習させた「デジタルクローン」を作成できる機能も多くのユーザーに支持されています。スマートフォンで撮影したわずか数分程度の映像をアップロードするだけで、自分そっくりの分身をデジタル空間に生み出すことができるのです。

HeyGenのウェブサイトのトップページ

HeyGenのウェブサイトです。GoogleやAppleのアカウントでサインインできます。

 一度自分専用のカスタムアバターを作ってしまえば、本人が出張中であっても体調を崩していても、パソコンの前でテキストを入力するだけで本人が喋っている動画をいくらでも生成できます。経営者のメッセージ動画や、属人化しやすいトップ営業マンのプレゼンを簡単に再現し、いつでもどこでも高品質な情報を発信できる体制が整うわけです。

 さらに、40カ国語以上の言語と300種類以上の声色に対応した音声合成機能の高さも見逃せません。入力した日本語の原稿をそのまま外国語に翻訳し、同じアバターの口の動きを完全に一致させながら、流暢な英語や中国語で話す動画を一瞬で作成する機能も搭載されています。

 「リップシンク」と呼ばれるこの同期技術は、言葉のアクセントや息継ぎのタイミングまでも正確にシミュレーションします。ただ言葉を置き換えるのではなく、本当にその言語のネイティブスピーカーが話しているかのような錯覚を覚えるほどの仕上がりなんです。

 人間であれば多大な時間と費用がかかる多言語展開を、クリック一つで完結できる部分が、グローバルに事業を展開する企業から高く評価される理由といえます。最新のAIモデルが話者の細かい感情の起伏まで学習し、単なる機械音声を脱却した伝わる言葉を再現しているのです。


HeyGenの翻訳機能で先ほどの動画の中国語バージョンを生成できました

膨大なコストと作業時間を削減して新たな価値を生み出すビジネス現場での実践的な活用法

 動画制作の内製化を強力に後押しするHeyGenは、あらゆるビジネス課題の解決策として急速に普及が進んでいます。最も即効性が高い活用分野の一つが、社内向けの研修やマニュアル動画の作成です。文字と図解だけの分厚いマニュアルは従業員に読まれにくいという悩みを抱える企業は多いですが、アバターが要点を解説する動画に置き換えることで、圧倒的に理解度と学習の定着率が高まります。

 社内システムの操作説明や定期的なコンプライアンス研修など、頻繁に内容のアップデートが必要なコンテンツでも、HeyGenであればテキストを一部修正して再生成ボタンを押すだけで最新版の動画が完成します。担当者が毎回カメラの前に立って撮り直す必要はもうありません。

 マーケティングや広報活動におけるプロモーション動画の量産も、強力なユースケースとして定着しつつあります。YouTubeの解説動画や各種SNS向けのショート動画、Web広告のクリエイティブなどを自社で迅速に制作できるため、外注費用の大幅な削減になるのです。

 実際にある携帯電話の販売代理店では、月に30件以上の業務説明やプロモーションをAI動画に置き換えることで、年間で1500万円以上の大幅なコストカットに成功した事例も報告されています。高額なギャラが発生するプロのナレーターやモデルを雇わずとも、自社のブランドイメージに合ったアバターを無制限に活用できる恩恵は計り知れません。新商品の発表ごとに迅速に動画を展開できるため、市場のトレンドを逃さずにアプローチを続けることが可能です。

 日々の営業活動の質を劇的に向上させるツールとしても力を発揮します。例えば、見込み顧客にPDFの提案書をメールで送付する際、資料の隅にアバターが概要を1分間でプレゼンする動画を添えるといったアプローチが可能になります。テキストだけではどうしても伝わりにくい熱量や言葉の細かいニュアンスを補完でき、競合他社との差別化を図る強力な武器となります。

 日本語で作った営業資料を動画化し、そのまま英語やスペイン語に翻訳して海外のクライアントに送付するといった離れ業も、特別な語学スキルなしで実行可能です。かつては専門の制作会社に依頼していた多言語対応のセールス動画が、誰でもデスクにいながら作れてしまう。国境や言語の壁を越えたコミュニケーションを日常的なものに変えてしまうポテンシャルを秘めているのです。

天秤AI byGMO

今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!

無料で天秤AI by GMOを試す

写真1枚とテキストでOK!直感的な操作でバーチャルアバター動画を作成する

 では、実際に使ってみましょう。まずは手軽なバーチャルアバターから試してみます。「Avatars」から「Create Avatar」をクリックし、「Create a virtual character」を開きます。「Upload Photo」をクリックし、自分の写真をアップロードします。なるべく上半身に寄った写真の方がよいでしょう。

 名前や年齢を設定したら声を選びます。まずは、プリセットされた声を選びます。「Language」から「Japanese」を選び、女性の声を聞いてみましょう。ここでは、「Kyoko」を選びました。

HeyGenのプリセット音声選択画面。日本人女性の声が4人分登録されている

プリセットされている声を選びます。日本人女性だけでも4人登録されていました。

 続いて、喋らせる映像を作ります。「MyAvatar」を開くと、先ほど登録した写真がありますが、私の顔で別の映像を生成することもできます。「Add a look」→「Design with AI」をクリックし、プロンプトを入力しましょう。下には、様々なサンプルがあるので、選択するだけでもOKです。ここでは、スタジオのようなところでスーツを着ているような写真を生成しました。

HeyGenのMyAvatarでDesign with AIをクリックする画面

「MyAvatar」で「Design with AI」をクリックします。

場所や服装、ポーズ、小物などのプロンプトを入力して元画像を作成する画面

場所や服装、ポーズ、小物などをプロンプトに入力して元画像を作ります。

 画像を選んだら、いよいよ動画作りです。左側の「Script」のところに台本を入力し、再生ボタンを押しましょう。これだけで、日本語の音声が再生されます。まずは、音声のみが再生されるので、満足するまでチューニングしましょう。

 AIの読み上げは完ぺきではありません。例えば、別の単語を一息で読んでしまったり、漢字の読みが間違っていることもあります。そんな時は、読点で区切ったり、ひらがなに開きましょう。読み上げ速度を調整するなら、「Voice」の「Kyoko」をクリックします。「Speed」のスライダーで速くしたり遅くしたりできます。

 音声が完成したら、「Generate」をクリックすると動画が生成されます。この時に生成したのが、冒頭に掲載している動画になります。口の動きはセリフに同期していますし、瞬きしたり、頭や手も動いており、本物の人間に見えますよね。もちろん、リアルと見分けがつかない、とは言いませんが、驚きのクオリティです。

HeyGenで音声をチューニングし、Generateで動画を生成する画面

音声をチューニングし、完成したら「Generate」で動画を生成できます。

自分の声と顔を完全再現!デジタルクローン作成と驚きの多言語翻訳機能

 次は、自分の声を学習させてみましょう。アバターの生成画面で、今度は「Clone a real person」をクリックします。第三者の声を悪用されないように、本人確認が必要です。ウェブカメラやスマホのカメラで自撮りし、画面に表示された文章とコードを読み上げましょう。ここでは、英語が表示されますが、自然体で読んでください。噛んでも構いません。今回は、同僚のAIライターである相坂ソウタ君にチャレンジしてもらいました。

HeyGenのClone a real personをクリックする画面

「Clone a real person」をクリックします。

 次に、学習に使う音声を登録します。ここで、先ほど作成した声を使うことも可能です。英語で話していますが、そのまま日本語に転用することもできます。しかし、少しでもクオリティを上げたいなら、別途録音した音声ファイルをアップロードするとよいでしょう。

 静かな場所で、スマホの録音アプリなどに2分程度話しかけ、そのファイルをアップロードすればOKです。話す内容は何でも構いません。生成AIに台本を考えてもらい、読み上げればいいでしょう。

本人確認の自撮りが終わり、学習に使う音声を選択する画面

本人確認を兼ねた自撮りが終わったら、学習に使う音声を選択します。

 先ほどと同様に、利用する映像を生成してもらいました。ここでは、ショート動画を意識して縦型にしてみました。先ほどと同様にセリフを入力し、納得いくまで調整しましょう。

 例えば、最初「1,2分」と書いていたのですが、きちんと読み上げることができなかったので、「2分くらい」にしました。「大幅に削減」も読みを間違えていたので、ひらがなに開きました。後になってやり直すよりも、ここできっちり調整しておくことをおすすめします。納得いったら、「Generate」をクリックして動画を生成しましょう。

HeyGenで新しいLookを作成し、Use in Videoをクリックする画面

新しい「Look」を作成し、「Use in Video」をクリックします。

HeyGenでセリフを入れてチューニングする画面

セリフを入れ、チューニングします。


HeyGenで生成されたデジタルクローン動画


 同じ動画の他言語バージョンを作ってみましょう。生成された動画を開き、「Edit」タブの「Translate」をクリックします。後は、プルダウンメニューで翻訳先の言語を選ぶだけです。

 しかし、そのままだと言語が日本語になっていて、日本人がその言語を発音しているような違和感があります。ネイティブに発音させたいなら、「Voice」の設定画面を開き、言語設定を変更しましょう。

 セリフの翻訳は「HeyGen」がやってくれたのですが、完ぺきでした。気になる人は、別途自分で用意した別言語の台本を貼り付けることもできます。後は、これまでと同じく、チューニングし、動画を生成します。

HeyGenのTranslate機能でソウタ君に英語で話してもらった画面

「Translate」をクリックし、翻訳できます。ソウタ君には英語で話してもらいました。


生成された英語翻訳版の動画


 「動画制作ってどうしてもハードルが高い……」そんなふうに感じている方にこそ、HeyGenはぴったりのツールです。大掛かりな撮影機材も、カメラの前に立つ緊張感も必要ありません。テキストを打ち込むだけで、自分の分身が代わりにスラスラと喋ってくれるなんて、なんだかちょっとワクワクしますよね。

 多言語への翻訳やデジタルクローンといった便利な機能も、すでに多くのビジネス現場で当たり前のように活用されていて、日々の業務をしっかりサポートしてくれています。社内のちょっとしたマニュアル動画から、海外のお客様へのご案内まで、アイデア次第で使い道はぐっと広がります。無料プランも用意されており、サクッと始められるので、まずはご自身のアバターを作って、その手軽さをぜひ体験してみてください。

この記事を共有:
  • facebook
  • line
  • twitter
天秤AI by GMOイメージ

最新のAIが勢ぞろい! 天秤AI by GMOなら、最大6つのAIを同時に試せる!

無料天秤AI by GMOを試す