VOICEPEAKってなに?
会社のオフィシャルな動画を作る場合など、素人の自分がナレーションをするわけにはいかず、かといってナレーションを外部に依頼するほどコストもかけられないという状況で、皆さんはどうしているでしょうか?
そういう時に便利なのがVOIDEPEAKです。
VOICEPEAKは文字で入力した言葉を読み上げて、音声ファイルにしてくれるソフトウェアです。VOICEPEAKで作成した音声ファイルを動画に合わせることで、解説動画が簡単に作れます。
使用しているエンジンは違いますが、初音ミクなどのVocaloidのナレーション版といったイメージです。
実際に私が作った、日本仮想化技術のかんたんDevOpsの紹介動画がこちらです。
すこし自動読み上げ感はありますが、かなり人間が読んでいるのに近い表現をすることができます。
ナレーションの作り方
ナレーションはどのタイミングで、どの声で、どのようなセリフ(スクリプト)を読み上げるかを指定していきます。
普通に読み上げて欲しい文章を入力していけば良いのですが、ここでコツがあります。
まず、 VOICEPEAKでは句読点のタイミングでナレーションが間をとってくれます。そのため、句読点の入れ方は読み上げ結果を意識して入れておく必要があります。
また、ブロック(白いボックスで囲まれたスクリプトの範囲)を読み上げ開始のタイミングから一気に読み上げるので、どの範囲をブロックとするのかも重要なそうそになります。感情表現やスピード、ピッチといった部分に関してもブロック単位で設定が可能です。
そのままの状態でもかなり人間が話している感じ位に近いのですが、部分的に予想外のアクセントやイントネーションで再生されることがあります。とくに、一般的ではない言葉や自分で辞書登録使用した言葉を使用する場合などは、その傾向が顕著です。そういった時はアクセントやイントネーションを調整することで、より人間が話しているようなナレーションに近づけることができます。
頑張れば方言のようなイントネーションも表現することができるかもしれません。
ちなみに、言葉の間の間も微調整することができますが、こちらは結構大変なので、一気に読ませた方が良さげです。
あと、漢字や英単語に関しては正しい読み方で読み上げてくれないことがあるので、このアクセントやイントネーションの画面で修正することができます。
動画とナレーションを合わせる
動画に組み込んでいくには、動画編集ソフトを使って音声ファイルと合わせていきます。音声ファイルの書き出しは、全体を一つのファイルとすることもできますし、ブロックごとに分割したファイルとして書き出すこともできます。
音声に合わせて動画を作成する場合には音声ファイルを一つで書き出すようにします。動画が既にある場合は、ブロックごとにファイルを書き出して、動画編集ソフトでナレーションのタイミングを調整するようにします。
ただ、実際に動画に合わせてナレーションを調整するのは非常に難しいです。というのも、動画ありきの場合は、伝えたい内容に対してナレーションのスピードが間に合わないことがよく発生します。そのため、状況が許す限り、あらかじめスクリプトを用意して、それに合わせて動画を作成した方が良いでしょう。
もし、それができない場合は、スクリプトの量をできるだけ少なくするなどして、動画のスピードに追いつくように調整する必要があります。
ここが惜しい!
先ほどの動画のように、かなり人間ぽいナレーションを簡単に作ることができるのですが、もうちょっと頑張って欲しいと思うところもあります。
一番惜しいのが、英語の読みに対しては壊滅的に対応できていません。簡単な単語でもアルファベットを一文字一文字読み上げていくような形になってしまいます。それを一つ一つ辞書登録をしていかなければいけないのは、結構手間です。
もう一つが、句点と読点の間の取り方を別に設定できないという点です。やはり、句点の方が読点よりも少し長めの間を取りたいという思いがあります。その辺りを調整できるようになれば、もう少し聞き取りやすいナレーションを楽に作れるようになると思います。
とはいえ、便利
そうはいっても、ある程度のクオリティのナレーションを簡単に作ることができるVOICEPEAKは非常にありがたいツールです。
やはり、聞いてもらうには聞きやすいナレーションは欠かせません。動画作成の機会があるような方は、VOICEPEAKを試してみてはいかがでしょうか?