スポンサーリンク

【自動文字起こし】Googleドキュメントで簡単作成♪どんな音声ファイルでも出来ます☆

文字起こし IT

音声が出る形式なら何でも自動文字起こしが出来ます。

  • MP4
  • MP3
  • YouTube
  • ニコニコ動画

などなど。

マイクを繋げれば、しゃべるだけで自動で文字にしてくれます。

この記事では、誰でも出来るように画像、30秒ほどの動画付きで解説しています。

ざっくり内容
  • Googleドキュメントに音声を認識させる準備
  • 自動文字起こしの精度を上げるコツ
  • 上手くいく音声と難しい音声の違い

 

Windows、ChromeでGoogleドキュメントを使ってYouTubeの動画を文字起こししてみました。

Googleドキュメントに音声認識させる

まずは、Googleドキュメントに音声を認識させる準備があります。
難しいことはありませんので画像通りに進めていただくと簡単にできます。

PC画面右下のスピーカーマークをクリックします。
スピーカー名をクリックすると
再生デバイスが2つある場合、2種類の再生デバイスが表示されます。

再生デバイスとは、スピーカーのことです。
PC本体のスピーカーとディスプレイのスピーカーがある場合、2つ表示されます。

ディスプレイのスピーカー名にはメーカーの名前が表示されることがありますので、PCのスピーカーがわからない場合、それ以外を選択してください。
私のディスプレイはBenQです。

再生デバイスをPC本体に選べましたら、
またPC画面右下のスピーカーマークを右クリックします。

文字起こし

サウンドという項目が出ますのでクリックします。
サウンド設定画面が出ましたら、録音タブをクリックします。

ステレオミキサーがありますのでクリックして既定値に設定、OKを押して準備は完了です。

文字起こし

最初から「既定のデバイス」になっている場合があります。

これで流れている音声はデータとして内部に取り込まれます。
マイクでしゃべっていることと同じ効果になります。

ここまでのおさらい。
動画で解説します。
見づらい場合は、画面を2回タッチ、またはクリックしてください。

スピーカーをPC本体に設定する。

 

PC画面右下のスピーカーマークを右クリックし、
録画タブを開きステレオミキサーをクリックして既定値に設定。

 

これで音声をPC内部に流すことが出来ます。

自動文字起こしをする準備

文字起こし

デスクトップ画面に
Googleドキュメントと文字起こししたい音声ファイルを並ばせます。

今回は、私のYouTubeゲームチャンネルで解説します。
(宣伝じゃないよ。。。)

次は、Googleドキュメントの開き方とYouTubeを横並びにする方法です。
分かる方は飛ばしてくださいね。

Googleドキュメントを開く

Chrome検索画面で右上のGoogleアプリを開き、Googleドキュメントをクリックします。

文字起こし

『新しいドキュメントを作成』枠の『空白』をクリックします。

文字起こし

無題のドキュメントが開きましたら、
『ツール』『音声入力』の順番にクリックします。

文字起こし

音声入力のスイッチ画面がでます。

文字起こし

これでGoogleドキュメントの準備が出来ました。

マイクを使って自分の声を自動文字起こしするのであれば、
この段階で音声入力スイッチを押して話すことで自動文字起こしが出来ます。

Googleドキュメントと音声ファイルを並べる

ここでいう音声ファイルはYouTube動画で説明します。

Chromeの右上の赤丸をクリックします。

文字起こし

サイズを合わせるにはChromeブラウザ画面のふちにカーソルを合わせてクリックしたまま、動かすと画面サイズが変わります。

文字起こし

また新たにChromeを開きます。
YouTubeを表示させ、先程のようにブラウザを小さくします。

サイズを合わせて横並びにします。

文字起こし

Chromeブラウザを横並びにする方法は、これ以外にもありますのが今回はこの方法で説明しました。

準備はここまでです。
次は自動文字起こしをやってみます。

自動文字起こしの方法

自動文字起こしをするには、
YouTubeの再生ボタンとGoogleドキュメントのマイクボタンを押さないといけませんので、どうしても多少のタイムラグが発生します。

文字起こし

Googleドキュメントの
マイクボタンを先に押しても作動しません
ので、

  1. YouTube再生
  2. マイクボタン

の順番にクリックする必要があります。

そして、読み取られた文字は100%完璧ではありません。
『改行』も『、』『。』も表示されません。

文字起こし

文字起こしが出来ましたら、ある程度自分で修正する必要があります。

出来上がった文章をザックリ改行などして整えます。
この時に明らかに漢字間違いや読み込み間違いがあった場合はわかる範囲で直してしまいます。

そして最後に
音声を聞きながら文章を見て
直したり、足したりして仕上げていきます。

音声を止めながらタイピングするより早いと思います。

認識しやすい動画と認識しづらい動画

認識しやすい動画は、音声がはっきりと聞き取れるものです。

自分で聞いても分かるものが良いです。

また、動画にBGMや効果音が強く出ていると音声を認識しづらくなります。

認識しやすい動画

はっきりと聞き取れる例として
イケハヤ大学というYouTuberさんの動画音声を30秒ほど自動文字起こししてみました。

(※YouTube画面は控えさせて頂きました。)

先程も話したとおり、冒頭にタイムラグが発生していますが結構、一致しているのではないでしょうか。
少し、早口なので若干違うところがありますね。

ケアレス今日は1億円持ってても98目のカップ麺を食べる理由について話したいと思います僕はね一応まあ会社のことを女としたんが一応一応件以上あるということでその先はねのんびりセミリタイア押しおりますでも午後はだいたいねずっとゲームやってますマジでずっとスマブラってますま午前中ちょっと YouTube とって午後はゲームをするという感じにものんびり暮らしておりますはでランチは何かって言うとね僕はいつも98円のラーメン食ってんすよこれこれこれ今日はどこのマルちゃんとねおそば屋さんの鴨だしそばこれねこれを買いました後プロテインハイプロテイン…

参照:イケハヤ大学【富裕層のリアル】1億円あっても98円のカップ麺を食べる理由。

読み込み速度も速くて、ほぼ止まることがありませんでした。

認識しづらい動画

BGMや効果音をつかっている動画は、非常に認識しづらいです。
カズチャンネルというYouTuberさんの動画を30秒ほど自動文字起こししてみました。

(※YouTube画面は控えさせて頂きました。)

最後、強い効果音があり読み込みが止まってしまいました。

雨がすごいないというわけでどうもかチャンネルの数でございますえりちゃんですはい私もえりちゃんですはいというわけで今から2019年最後の花っておかしくねえんゆうとパソコンでございます助け今年いろいろコストコさんには特に数名刺のほどお世話になっておりまして勝手に勝手勝手に作ってるだけなんですけども買ってよかったやつですね今から探しに行きたいなと思いますよろしくお願いします 

参照: カズチャンネル/Kazu Channel【コストコ版】買って良かったもの!2019年版

音声はよく聞こえていましたが、効果音によってかき消されてしまいました。

この他にエコーが掛かっている音声や加工されている音声、複数人の声が入り混じる音声は認識しづらいです。

止まってしまった場合は、
すぐにまたマイクボタンをクリックして再開させます。

文字起こしの精度を上げるコツ

動画にもよりますが、文字起こしの精度を上げるコツがあります。

  1. 再生速度を遅くする

です。

音声入力はパソコンがあくまでも
『聞いて』いるので
音声を遅くすることで認識しやすくなります。

元の音声の速さにもよるので
一概に速さの倍率は決められません。
遅すぎても認識しませんので、自分で聞いて聞きやすい速度が良いと思います。

人と同じですね。
早口で喋られるより、ゆっくり話された方が聞きやすいです。

音量を大きくするということを聞きますが、
あまり関係ないかと思います。

先程、パソコンが『聞く』と言いましたが、物理的なマイクがあるわけでは無いので関係ないと思います。
音量1でも100でも仕上がりの差はありません。

が、しかし音量0のミュートはダメですよ。
音が出ていないことになるので認識してくれません。

スマホでも出来る

スマホのマイクから音声入力で自動文字起こしが出来ます。

スマホでもPCでもGoogleドキュメントの開き方は同じです。

Googleドキュメントを開いたら、右下の+マークをタップして新規ドキュメントを選びます。
入力方法の設定からGoogle音声入力を選びます。

機種によって多少操作の違いがありますが、同じような設定をしてみてください。

これでスマホマイクにしゃべるだけで自動文字起こしが出来ます。

まとめ

音声の文字起こしをする際、1から耳で聞いて書き起こすより、
Googleドキュメントを使えば、遥かに早いですね。
最後に自分の耳で聞き、手直しするだけで済みます。

ただ、100%完璧ではなくBGMや効果音、エコーが掛かっている音声は認識しづらいので、やはり音声次第なところはありますね。

最後までご覧いただき、ありがとうございました。

コメント

タイトルとURLをコピーしました