2021年11月25日木曜日

Streamを文字起こしに活用する

興津会が終わり、少しひっそりとしているガリラボです。
今日は4年(18)の玉名チーム「タマにゃんず」のバーチャルツアー班(高田・河合・中村)が交代で360度動画づくりを頑張っていました。

さて、私は、現在、研究の一環で、11月に入って卒業生と一部在学生に協力してもらい、インタビュー取材を行っています。
16~18ゼミから男女・県内外という条件から選んだ各5人にお願いしています。
質問項目は10問で、共同研究者と意見交換しながら1カ月以上かけて質問内容及び質問文を練り上げました。
協力が得られた人たちには、事前に、質問文と各問について協力者の記憶を出来るだけ思い出してもらえるよう想起ツールを添えて送付し、インタビューが順調に手短に終わるようにしています(それでも1人あたり約1時間ほどの時間がかかります)。

1時間ですが、質問し、その時の返答に応じで追加質問をしていくことをやっていると、1時間に費やす集中力はかなりなもので、それなりに疲れます。
ただ、ゼミ生と話をするのは楽しい。
特に卒業生と1時間も話するのはなかなかないので、楽しい時間になっています。
今日はダブルヘッダーとなり、午前がOG(17)川上、夕方がOG(17)岩奥。
今年の3月までは研究室で直接会っていた2人です。
取材だけでなく、ついでに近況も色々と聞けて面白い時間でした。
なお、岩奥は鹿児島の天文館からでした。こうした調査が可能なのも、オンラインだからです。オンラインが普通に使えるようになって、やれることがぐっと増え、便利になりました。

1時間近くの取材を文字起こしするとおおよそ1万字を超えます。計画では15人を取材するため15万字となります。
文字起こしには膨大な時間がかかるので、さてどうしたものかと色々と考え、音声認識レベルの高い方法はないかといくつか試した結果、ZOOMでの取材を動画に記録し、それをOffcie365のStreamにアップして、キャプションを生成させることにしました。
生成された文章はそのままではもちろん読めたものではなく、編集が必要です。
生成されたキャプションをダウンロードし、それをExcelに取り込み、時間と文章以外にStreamが吐き出す余計なテキストはExcelのフィルタで取り除きます。
それをWordでコピペすれば、時間データとその時のキャプションのペアが出来るので、映像の場所を時間データで確認しながら編集していくと、文字起こしがかなりスムーズに行えます。
それでも、1人1万字の文字起こしには3~4時間ほどを要しました。
ただ、Streamが使えなければ、そんな時間では終わらず、たぶん私の場合、文字起こし自体を放棄し、計画を変える羽目になっていただろうと思います。
計画と使えるツール(テクノロジー)はセットとして考えるべきですね。
 
Streamは動画配信用のツールなわけですが、Excelと組み合わせることで、文字起こしツールとして活用できそうです。
自分の手に入るものを組み合わせ、やるべきことを達成していく。
ブリコルール的な野生の思考は、データ社会でも必須ではないかと思います。^^;