音声が出る形式なら何でも自動文字起こしが出来ます。
- MP4
- MP3
- YouTube
- ニコニコ動画
などなど。
マイクを繋げれば、しゃべるだけで自動で文字にしてくれます。
この記事では、誰でも出来るように画像、30秒ほどの動画付きで解説しています。
- Googleドキュメントに音声を認識させる準備
- 自動文字起こしの精度を上げるコツ
- 上手くいく音声と難しい音声の違い
Windows、ChromeでGoogleドキュメントを使ってYouTubeの動画を文字起こししてみました。
Googleドキュメントに音声認識させる
まずは、Googleドキュメントに音声を認識させる準備があります。
難しいことはありませんので画像通りに進めていただくと簡単にできます。
PC画面右下のスピーカーマークをクリックします。
スピーカー名をクリックすると
再生デバイスが2つある場合、2種類の再生デバイスが表示されます。
再生デバイスとは、スピーカーのことです。
PC本体のスピーカーとディスプレイのスピーカーがある場合、2つ表示されます。
ディスプレイのスピーカー名にはメーカーの名前が表示されることがありますので、PCのスピーカーがわからない場合、それ以外を選択してください。
私のディスプレイはBenQです。
再生デバイスをPC本体に選べましたら、
またPC画面右下のスピーカーマークを右クリックします。
サウンドという項目が出ますのでクリックします。
サウンド設定画面が出ましたら、録音タブをクリックします。
ステレオミキサーがありますのでクリックして既定値に設定、OKを押して準備は完了です。
最初から「既定のデバイス」になっている場合があります。
これで流れている音声はデータとして内部に取り込まれます。
マイクでしゃべっていることと同じ効果になります。
ここまでのおさらい。
動画で解説します。
見づらい場合は、画面を2回タッチ、またはクリックしてください。
スピーカーをPC本体に設定する。
PC画面右下のスピーカーマークを右クリックし、
録画タブを開きステレオミキサーをクリックして既定値に設定。
これで音声をPC内部に流すことが出来ます。
自動文字起こしをする準備
デスクトップ画面に
Googleドキュメントと文字起こししたい音声ファイルを並ばせます。
今回は、私のYouTubeゲームチャンネルで解説します。
(宣伝じゃないよ。。。)
次は、Googleドキュメントの開き方とYouTubeを横並びにする方法です。
分かる方は飛ばしてくださいね。
Googleドキュメントを開く
Chrome検索画面で右上のGoogleアプリを開き、Googleドキュメントをクリックします。
『新しいドキュメントを作成』枠の『空白』をクリックします。
無題のドキュメントが開きましたら、
『ツール』『音声入力』の順番にクリックします。
音声入力のスイッチ画面がでます。
これでGoogleドキュメントの準備が出来ました。
マイクを使って自分の声を自動文字起こしするのであれば、
この段階で音声入力スイッチを押して話すことで自動文字起こしが出来ます。
Googleドキュメントと音声ファイルを並べる
ここでいう音声ファイルはYouTube動画で説明します。
Chromeの右上の赤丸をクリックします。
サイズを合わせるにはChromeブラウザ画面のふちにカーソルを合わせてクリックしたまま、動かすと画面サイズが変わります。
また新たにChromeを開きます。
YouTubeを表示させ、先程のようにブラウザを小さくします。
サイズを合わせて横並びにします。
Chromeブラウザを横並びにする方法は、これ以外にもありますのが今回はこの方法で説明しました。
準備はここまでです。
次は自動文字起こしをやってみます。
自動文字起こしの方法
自動文字起こしをするには、
YouTubeの再生ボタンとGoogleドキュメントのマイクボタンを押さないといけませんので、どうしても多少のタイムラグが発生します。
Googleドキュメントの
マイクボタンを先に押しても作動しませんので、
- YouTube再生
- マイクボタン
の順番にクリックする必要があります。
そして、読み取られた文字は100%完璧ではありません。
『改行』も『、』『。』も表示されません。
文字起こしが出来ましたら、ある程度自分で修正する必要があります。
出来上がった文章をザックリ改行などして整えます。
この時に明らかに漢字間違いや読み込み間違いがあった場合はわかる範囲で直してしまいます。
そして最後に
音声を聞きながら文章を見て
直したり、足したりして仕上げていきます。
音声を止めながらタイピングするより早いと思います。
認識しやすい動画と認識しづらい動画
認識しやすい動画は、音声がはっきりと聞き取れるものです。
自分で聞いても分かるものが良いです。
また、動画にBGMや効果音が強く出ていると音声を認識しづらくなります。
認識しやすい動画
はっきりと聞き取れる例として
イケハヤ大学というYouTuberさんの動画音声を30秒ほど自動文字起こししてみました。
(※YouTube画面は控えさせて頂きました。)
先程も話したとおり、冒頭にタイムラグが発生していますが結構、一致しているのではないでしょうか。
少し、早口なので若干違うところがありますね。
ケアレス今日は1億円持ってても98目のカップ麺を食べる理由について話したいと思います僕はね一応まあ会社のことを女としたんが一応一応件以上あるということでその先はねのんびりセミリタイア押しおりますでも午後はだいたいねずっとゲームやってますマジでずっとスマブラってますま午前中ちょっと YouTube とって午後はゲームをするという感じにものんびり暮らしておりますはでランチは何かって言うとね僕はいつも98円のラーメン食ってんすよこれこれこれ今日はどこのマルちゃんとねおそば屋さんの鴨だしそばこれねこれを買いました後プロテインハイプロテイン…
読み込み速度も速くて、ほぼ止まることがありませんでした。
認識しづらい動画
BGMや効果音をつかっている動画は、非常に認識しづらいです。
カズチャンネルというYouTuberさんの動画を30秒ほど自動文字起こししてみました。
(※YouTube画面は控えさせて頂きました。)
最後、強い効果音があり読み込みが止まってしまいました。
雨がすごいないというわけでどうもかチャンネルの数でございますえりちゃんですはい私もえりちゃんですはいというわけで今から2019年最後の花っておかしくねえんゆうとパソコンでございます助け今年いろいろコストコさんには特に数名刺のほどお世話になっておりまして勝手に勝手勝手に作ってるだけなんですけども買ってよかったやつですね今から探しに行きたいなと思いますよろしくお願いします
音声はよく聞こえていましたが、効果音によってかき消されてしまいました。
この他にエコーが掛かっている音声や加工されている音声、複数人の声が入り混じる音声は認識しづらいです。
止まってしまった場合は、
すぐにまたマイクボタンをクリックして再開させます。
文字起こしの精度を上げるコツ
動画にもよりますが、文字起こしの精度を上げるコツがあります。
- 再生速度を遅くする
です。
音声入力はパソコンがあくまでも
『聞いて』いるので
音声を遅くすることで認識しやすくなります。
元の音声の速さにもよるので
一概に速さの倍率は決められません。
遅すぎても認識しませんので、自分で聞いて聞きやすい速度が良いと思います。
人と同じですね。
早口で喋られるより、ゆっくり話された方が聞きやすいです。
音量を大きくするということを聞きますが、
あまり関係ないかと思います。
先程、パソコンが『聞く』と言いましたが、物理的なマイクがあるわけでは無いので関係ないと思います。
音量1でも100でも仕上がりの差はありません。
が、しかし音量0のミュートはダメですよ。
音が出ていないことになるので認識してくれません。
スマホでも出来る
スマホのマイクから音声入力で自動文字起こしが出来ます。
スマホでもPCでもGoogleドキュメントの開き方は同じです。
Googleドキュメントを開いたら、右下の+マークをタップして新規ドキュメントを選びます。
入力方法の設定からGoogle音声入力を選びます。
機種によって多少操作の違いがありますが、同じような設定をしてみてください。
これでスマホマイクにしゃべるだけで自動文字起こしが出来ます。
まとめ
音声の文字起こしをする際、1から耳で聞いて書き起こすより、
Googleドキュメントを使えば、遥かに早いですね。
最後に自分の耳で聞き、手直しするだけで済みます。
ただ、100%完璧ではなくBGMや効果音、エコーが掛かっている音声は認識しづらいので、やはり音声次第なところはありますね。
最後までご覧いただき、ありがとうございました。
コメント