お世話になっております。ファンリピート代表の竹村です。
当社では、ITコンサルティングの事業を行っておりまして、最近はAIをどのように業務に活用していくかという視点で仕事を行う機会が増えました。
GPTのようなテクノロジーは社会に与えるインパクトが特に大きいと感じているため、従業員にどのように使い方を周知していくか、という点を課題に感じており、前回の記事で、AI(GPT-4)を業務に活用する際の研修プログラムの草案を作成しました。
今回は、そのGPT(ChatGPT)を会社の業務に活用するための研修プログラムの草案を、D-IDというサービスを活用して、アバターが解説する動画を作成してみました。
D-IDは、Text-to-Videoと呼ばれる、テキストから動画を生成する技術をプラットフォームとして提供しているサービスです。アバター画像と会話のテキストを入力すると、まるでそのアバター画像が本当に話しているかのように音声を読み上げてくれます。
実際に作成した動画がこちらです。
※今回の研修プログラムの内容や読み上げのためのテキストについては、GPT-4(ChatGPT)を活用して作成しています。
動画の制作には、大きく分けて3つのステップでAIを活用して作成いたしました。
- Midjourneyでアバター画像を生成する
- GPT-4(ChatGPT)で口頭での説明のためのスクリプトを生成する
- D-IDでアバター画像とテキストを渡して動画を生成する
関連記事:
Midjourneyでアバター画像を生成する
Midjourneyは、AIを利用した画像生成サービスです。このサービスは、ユーザーが指定したキーワードやディスクリプションに基づいて、AIが独自の画像を生成します。これにより、デザインやイラストレーションの制作時間を大幅に短縮し、クリエイティブなアイデアを効率的に形にすることが可能となります。
まずは、Midjourneyでアバター画像を生成します。プロンプトは下記の通りです。
beatiful teacher, woman, 25yo, head shot, looking at the camera ,hyper realistic , studio lighting ,no background
教師のようなアバター画像を生成できました。プロンプトをチューニングすれば、性別や国籍などを含めて画像の出力を帰れます。今回はこのまま利用します。
Midjourney公式サイト:https://www.midjourney.com
GPT-4(ChatGPT)で口頭での説明のためのスクリプトを生成する
次に、下記の記事で作成した「GPT(ChatGPT)を会社の業務に活用するための研修プログラムの草案」を、実際の研修プログラムで口頭で読み上げるシーンを想定して、GPT4(ChatGPT)に読み上げを考えてもらいます。
今回は導入パートの説明にスコープを絞って生成をします。
下記の「GPTを業務に活用するための研修プログラム」を口頭で説明したいと考えています。まず、動画として口頭で話す形式で、記事の概要を説明してください。
# GPTを業務に活用するための研修プログラム
## はじめに
近年、GPT(Generative Pre-trained Transformer)を始めとする自然言語処理(NLP)技術が急速に発展しています。これらの技術を効果的に業務に活用するためには、社員への適切な教育とトレーニングが必要です。本記事では、GPTを業務に活用するための研修プログラムの内容を紹介します。
上記のように、口頭での説明に適したスクリプトが出力されました。
こちらを活用してD-IDで動画を生成していきます。
ChatGPT公式サイト:https://openai.com/blog/chatgpt
D-IDでアバター画像とテキストを渡して動画を生成する
D-IDは、Text-to-Videoと呼ばれる、テキストから動画を生成する技術をプラットフォームとして提供しているサービスです。アバター画像と会話のテキストを入力すると、まるでそのアバター画像が本当に話しているかのように音声を読み上げてくれます。
下記の公式サイトから登録を行い、Midjourneyで生成したアバター画像をアップロードし、ChatGPTで生成したスクリプトを入れます。
D-ID公式サイト:https://www.d-id.com/
上記を入れた後に、Generate Videoというボタンを押して動画を生成します。
生成のために時間がかかりますが、5分ほど時間が経つと登録したメールアドレス宛に動画の生成が完了した通知が送られてきます。
実際に生成された動画が下記の通りです。
動画、音声ともにかなり人間に近い精度で出力されています。簡単な社内研修用の動画コンテンツの生成は、こういった動画+スライドで制作できるのではと感じました。
まとめ
今回の調査を通じて感じた点は下記の通りです。
- GPTを始めとしたAIの技術は、テキスト生成や画像生成だけでなく、動画生成の分野にも進出しており、実用性が高まっている
- 今回は研修プログラム用の動画作成を対象にしたが、営業スクリプト生成や説明会・ウェビナーの動画制作など、さまざまな用途で活用できそう
- コンサルティング業務でクライアントのIT投資判断を支援する際、GPTの存在を考慮する必要が出てくるか。例えば、自社AI技術を活用して、制作の自動化プロダクトに投資してきた企業のアセットが、GPTの普及により収益性が低下、損失を被る可能性が高い。
- GPTを社内向けコンテンツの制作業務に積極的に活用していこうと感じた
当社では、ITコンサルティングの事業を行っております。お客様のニーズに合わせ、上記のように最先端の技術を駆使して事業創出やコスト削減、パフォーマンス向上を徹底して行っております。
そのため、今後もGPT-4を活用した事業/業務改善の企画・提案を積極的に行って参ります。
ITコンサルタント・プロジェクトマネージャー、システムエンジニアと採用を随時進めておりますので、最先端技術を活用してビジネスの現場で成果を上げたい方はぜひ、当社の採用担当までご連絡ください。