AI文字起こしとChatGPTを使って長めのインタビューを整理

Work Method

インタビュー記事を書くのに、何度も録音データを聞き返すのが面倒だと感じているジャーナリストの方は多いのではないでしょうか。しかし、そんな苦労はもはや過去のもの。今やAIを活用することでインタビュー記事の下準備を大幅に短縮できます。ここでは僕が実践している方法をご紹介しましょう。この方法はインタビューだけでなく、会議の議事録作成にも活用できると思います。

インタビュー原稿にかかっていた苦労を大幅に短縮

今や、AI文字起こしツールを使えば、録音データから高精度な会話文を生成することができます。その上、ChatGPTを使って、生成した会話文を整理することも可能です。会話文から「あのー」とか「えーと」といった意味のない言葉を削って文章を読みやすくすることを「ケバ取り」と言いますが、このケバ取り作業をChatGPTに頼むことができるのです。

しかし、ChatGPTには1つ問題があります。それは、一度に受け渡せる文章に限界があるということです。日本語の場合、おおむね2000〜3000文字が上限となります。

では、どのようにして長文に渡るインタビューをケバ取りしてもらうのか? 僕はインタビュー文章をExcelのマクロで分割し、複数回に分けてChatGPTに処理してもらう方法を考えました。パッと見は面倒だと感じるかもしれませんが、インタビュー記事の作成を大幅に省力化してくれると思います。ぜひ一度お試しください。

この記事でできること

インタビューの録音データをテキスト化し、さらに不要な言葉を取り除いて読みやすくします。長時間に及ぶインタビューもChatGPTを使って整理します。

CLOVA Noteで自動文字起こし

音声データの読み込み

さて、それでは手順をご紹介していきましょう。最初は、CLOVA Noteにインタビューの音声ファイルを読み込ませます。

CLOVA Noteは、メッセンジャーサービスのLINEが提供しているAI文字起こしサービスです。課金しなくても600分/月まで利用できるのがうれしいところ。僕の使い方なら、だいたい利用可能時間で収まります。利用にはLINEアカウントが必要です。

肝心の音声認識の精度も、他のAI文字起こしサービスに比べて引けをとりません。僕はこれまで数種類のAI音声サービスを使い比べてきましたが、その中でもトップクラスの精度だと感じています。さらに、話者の切り分けの精度が高いのも魅力です。複数人数での会話も、実用的なレベルで切り分けてくれます。まだ使ったことがないという人は、この機会にぜひ試してみてください。

CLOVA Noteの公式サイトにアクセスし、右上の[ログイン]をクリックしてログインします(この記事では新規登録のステップは割愛します)。
ログインしたら、左上の[新しいノートを作成]をクリック。
この画面でファイルをアップロードします。
アップロードが完了すると、音声の種類を選択する画面が表示されます。僕はほとんど[インタビュー・相談]を選んでいますが、選択肢によって精度に差が出てくるかもしれません。
インタビューの種類を選択し終わると解析が始まります。解析の時間は、ほかのAI文字起こしサービスと比べて圧倒的に速いです。
解析が終わると、このように解析結果が表示されます。

話者の名前を登録

解析が終わった後は、話者の名前を登録していきます。デフォルトでは「参加者1」「参加者2」などとなっていますが、話者を登録しておくと見分けやすくなります。登録する名前は、「田中」や「佐藤」など、苗字を漢字で入れておくのがいいでしょう。

なお、極端に短いフレーズでは、話者を正しく認識できないことがあります。この場合、こまごまと話者を登録せずに放っておきましょう。「あー、はいはい」とか「そうですね」とか、意味のない相槌であるケースが多く、後ほどExcelで削除してしまいます。

アイコンの横にある「参加者1」などと書かれた部分にポインタを重ねると、鉛筆マークが表示されます。クリックしましょう。
[直接入力]部分に名前を入力し、[全体区間]を選んでから[変更]を押します。
「参加者1」と認識されていた部分がすべて変わりました。
同様の手順ですべての名前を割り当てていきます。
短いフレーズで話者を正しく認識していない部分は、登録作業を行わずにスルーしてしまってかまいません。そもそも意味のない相槌であることが多いです。

Excelデータに書き出し

名前の登録が終わったら、Excelデータとして書き出しを行います。CLOVA Noteでは複数の書き出し形式を選べますが、今回の作業の流れではExcel形式を使用します。

画面右上の[…]ボタンを押し、表示されたメニューから[音声記録ダウンロード]を選びます。
形式は[Excelファイル(.xlsx)]を選択。その下の[オプション情報]では、[時間記録]のチェックを外しておきます。[ダウンロード]ボタンを押すとダウンロードが始まります。
これでCLOVA Noteのステップは完了です。続いてExcelでの作業に入ります。

Excelを使って会話を分割

不要な相槌をカット

Excelでは、ChatGPTに受け渡すための下準備を行います。とはいえ、ここであまり時間をかけてしまうと、AIを使って効率化する意味がありません。不要な相槌(CLOVA Note上で登録を省いた話者)を削除する程度でいいでしょう。会話を誤認識しているところが気になるかもしれませんが、わざわざ直さなくても意外と問題ないものです。

なお、以下の手順はMac版のExcelで解説しています。Windows版のExcelだとメニューやボタンの位置が違うかもしれませんが、作業自体はWindowsでも問題なくできると思います。

ダウンロードしたExcelファイルは、日本語のフォントが割り当てられていないので、最初にそこを直します。全体を選択してフォントを変更しましょう。
最初の3行も不要なので削除します。4行目は空白行ですが残しておきます。
次に、先頭のA列に通し番号を入れます。後ほどセルの並べ替えをするのに使います。
余計な話者をまとめて削除するために、ソートをします。シート全体を選択してから[並べ替えとフィルター]→[フィルタ]を選びます。
先頭行に[▼]がついたと思います。続いてB1の[▼]を押し、[昇順]を選びます。これで話者によるソートができます。
CLOVA Note上で名前を登録していなかった話者の会話がひとまとめになります。
名前を登録していなかった話者の行をすべて選択して削除します。

※ソートしないで手作業で不要な会話を削除してもいい?

手作業で不要な会話を見つけて削除しても構いません。しかし、不要な相槌は意外とたくさん混ざっています。インタビューによっては、どうでもいい相槌が30回以上出てくることも。そうなると手作業で取り除いていくのは大変ですし、見逃しも出てきてしまいます。

削除が終わったら、A1の[▼]を押し、[昇順]を選びます。これで並べ替えを元通りにします。
これで不要な話者がカットできました。並べ替えはもう必要ないのでフィルタを解除します。

マクロ付き雛形に会話をペースト

ChatGPTは、1度に長い文章を扱うことができません。長い文章を渡そうとするとエラーが出てしまいます。また、エラーが出ないギリギリの分量でも、元の会話に存在しない会話を勝手に作り出すといったおかしな挙動をすることがあります。こうしたトラブルを避けるには、1度に受け渡す分量を2500文字くらいに留めておくのがオススメです。

では、どのようにして文章を小分けにするか。手作業で切り分けてもいいのですが、分量が多いと面倒です。そこでここでは、Excelのマクロを使って指定した行数ごとに切り分けます。

本記事をご覧の方の中には、Excelのマクロを扱うことに慣れていない人もいると思います。そこでここでは、すでにマクロの入ったテンプレートファイルを用意しました。このファイルを使っていただければと思います。

一定行数でシートを切り分けるサンプルファイル

上記のリンクをクリックしてファイルをダウンロードしてください。ZIPファイルで圧縮されているので、解凍してExcelで開きます。

Macの場合、マクロを有効にするか、無効にするかを尋ねられます。[マクロを有効にする]を選んでください。
このようなファイルが開きます。中には何も入っていません。
そこに、先ほど整理したExcelファイルの中のデータを全部コピー&ペーストします。

マクロを実行

マクロを実行すると、会話が22行ごとに分割され、それぞれ個別のシートになります。また、各シートの先頭には、「#次の文章をケバ取り #文章」という文字列も入リます。次のステップで説明しますが、これがChatGPTのプロンプトになります。

なお、分割する行数をもっと増やしたい、プロンプト部分の文章を変更したいという人は、「Visual Basic Editor」を使って、書き換えることができます。ここではVisual Basic Editorの説明を省略しますが、Visual Basicに詳しくなくても、部分的な書き換え程度ならそれほど難しいことではないでしょう。

マクロを実行します。Macの場合は[ツール]メニュー→[マクロ]→[マクロ]です。WIndowsの場合は、[表示]タブにある[マクロ]ボタンです。
[データを22行ごとに分割]という名称のマクロがあるので、それを選んで[実行]ボタンを押します。
すると22行ごとにシートが分割されます。各シートのB1のセルには「#次の文章をケバ取り #文章」という文字列が入リます。これでExcel側の準備は完了です。

ChatGPTで文章のケバ取り

カスタムインストラクションを設定

続いてChatGPTの作業に移ります。

「切り分けが終わったのだから、そのまま流し込めばいいのでは?」と思うかもしれませんが、もう少し辛抱してください。カスタムインストラクション(Custom instructions)を設定して、文章のケバ取りの精度を高めたいと思います。

カスタムインストラクションというのは、ChatGPTに何かを頼むとき、前提として知っておいてほしいことを登録する機能です。カスタムインストラクションを登録しておくことで、個別のプロンプトをシンプル化できます。

なお、今回のケバ取りのプロンプトについては、DIMEのチバさんの記事を参考にしました。そちらの記事もぜひ合わせてご覧ください。

議事録の精度がアップ!ChatGPTで文字起こしの内容を整えるテンプレートとは?|@DIME アットダイム

ChatGPTにアクセスしたら、左下の自分のアカウント名の隣にある[…]をクリックします。その中にある[Custom instructions]を選びます。
このような画面が出てきます。下側の枠に次の文章をコピペで入れてください。上の枠は何も入れなくてもかまいません。
文章をケバ取りと依頼があったら、文章から不要な文字をカットし、整文してください。ただし、文章の要約は行わないでください。

##不要な文字の例
・「あー」「えーと」「あの」「ああ」など、意味を持たない声や言いよどみ(間投詞・フィラー)
・「はいはいはい」「うんうんうん」「なるほど」など、過剰な相槌、無意味な繰り返し
・「やっぱり」「あの」など、つっかけ、言葉の噛み
・「7日、いや8日」など、明らかな言い間違え、とちり
・「ですねー」など、語尾伸ばし
・「やっぱり明日は、やっぱり雨だと、やっぱり思います」など、頻出する口癖
入れ終わったら[Save]ボタンを押して閉じます。これでカスタムインストラクションの準備は完了です。

コピペで文章を流し込む

お待たせしました。いよいよChatGPTに文章のケバ取りを頼んでいきましょう。僕はGPT-4を使っていますが、GPT-3.5でも動くのではないかと思います。また、「WebPilot」プラグインをオンにしておくと、おかしな挙動になる(勝手に作文を始めてしまう)確率が高まる気がします。この作業ではWebPilotプラグインをオフにしておくのがオススメです。

1番目のシートのB列とC列を選択してコピーします。
ChatGPTで[New chat]を開始して、コピーしたものをペーストします。
ケバ取りが開始されます。
送った分のケバ取りが終わったら、Excelに戻って2番目のシートのB・C列をコピーします。
ChatGPTに切り替え、先程の会話の続きで文章をペーストします。あとはシートの分だけ同じことを繰り返します。

ChatGPTでインタビュー後の整理を効率化しよう

作業は以上です。ChatGPTが整理してくれた文章をコピーして、テキストファイルなどにまとめておきましょう。

長々と書きましたが、一度やってしまえば、作業自体はそれほど面倒なものではありません。慣れてくるとほんの数分でChatGPTにケバ取り依頼をかけられるようになります。

一昔前は、インタビュー後の文字起こしは大変な作業でした。何度も録音データを聞き返して、文字を入力していって…。長いインタビューでは膨大な時間がかかっていました。しかし、今は自動文字起こしツールとChatGPTのおかげで、インタビュー後の整理が本当に楽になりました。ChatGPTが整理した文章は非常に読みやすく、インタビューに立ち会っていない人が読んでも内容を十分把握できるクオリティです。

しかし、これは裏を返せば、誰でもインタビューの整理ができるということでもあります。新米ライター・新米編集者でも、それどころかライターや編集者以外の人でも、キレイに整理されたインタビュー原稿を作り出せるのです。

そんな時代に、ライター・編集者は、自分の価値をどうやって出していけばいいのでしょうか。僕は、「インタビューのタイミングでどれだけ相手の話を引き出せるか」「ChatGPTが整理してくれた文章をベースにしながら、しっかりとしたストーリーを紡ぎ出せるか」という2点が大切だと考えています。

テクノロジーで便利になる部分は上手に利用しつつ、AIでは肩代わりできない部分の強みを磨いていきたいと思います。

この記事が、ライター・編集者の皆さんのお役に立てば幸いです。

ChatGPTを使わずにインタビューの整理をする方法はこちら

タイトルとURLをコピーしました