オフィスメーカーのオカムラと日本IBMが、IBM Watsonの音声認識サービスを活用して、会議の音声をリアルタイムにテキスト変換して議事録作成支援する「TalkView」を開発したという記事。
音声認識のソフトやツールは、もう20年以上前からあって、ただ文字入力用途よりも音声コマンド利用が中心でしたが。ただ、その当時でも英語でなら、ほぼ問題無く音声をテキスト変換して利用出来ました。日本語の場合は、漢字変換が入るから、どうしても同音で異なる感じへの変換とか、変換効率の点で課題があって、一度日本語テキスト変換してからの編集作業が逆に面倒だったりしましたが。当時は、音声変換すると言う事を念頭に置いて話をしていたから、スピードとか発音とか、どうしても逸れように話をするから、逆に使いづらい点もあったんですよね。それでも、最近のSiriとかGoogleアシスタント何度を使ってみると、本当に普通に話して結構ちゃんと認識して利用出来るから、技術の進歩は格段に進んでいるんだろうけど。
所で、この議事録作成支援システム。その時の会話とか発言内容をそのままテキストデータとして記録する位のことは、そんなに難しくは無いだろうけど、それを「議事録」としてまとめるのはどの程度Watsonとか、逸れ以外の技術が利用出来るんだろうか。例えば、実際に会話から変換されたテキストを後から読み直して、足りない部分を補完したり逆に紛らわしい所を整理したりしても、それが後で可視化できるような編集機能とかは必要ですよね。あと、音声データとテキストデータを比較して、修正した部分を音声認識のプログラムにフィードバックして、それで学習して精度を上げる機能とかも必要かも。一番気になるのは、単にその時の会話の流れを記録して、音声データをテキストデータにするだけなら、余り意味が無くて、そこはWatson君を入れるのであれば、有る程度の要約なり、会議の流れをレビューして、冗長な部分とか、途中で横道に逸れたところは割愛して表示するとか、そう言うインテリジェントな機能は欲しいところですよね。
昨今、いろいろな会議体の議事録とかその時のメモがある・ないと問題になるけれど、公の組織での会議では、こういう自動初期的なシステム利用を義務づけて、必ず記録させる、それは期限を切って保管する、期限が過ぎたら、それ以降はそれよりも長期間保存する定めた公式記録のみを「正本」として、個人的な記憶とかメモは採用しない、位の切り分けが必要なのでは。私も情報関係のエリアで仕事をしているけれど、確かに記録や情報を保存して、後に利用することは重要。ただ、それをずっと保存していくことは、再利用する予定が無いなら一定期間経過したら削除するなり廃棄するべき。人間で言えば、生まれてから今日までの記憶を全て保持していることが幸せなのか、必要なのか、と言う事ですよね。多少不利益はあっても、忘れることがあるから新しい記憶も許せるわけだし、なんと言っても物理的な記憶容量は限度があるわけだし。
今電話会議などで使用する、スマートスピーカーというかインテリジェントスピーカーみたいなシステムがちょっと流行みたいですが、そのうちに会議の議長が自分のスマホをテーブルの真ん中に出して、電脳秘書を呼び出してから会議を始めれば、電話参加でもその場での参加でも、全て会議内容を記録して、議事録を差制して、何ならAIがその後の進捗管理から始動迄もアシストしてくれると言う時代が、結構直ぐに実現するかもしれない。
0 件のコメント:
コメントを投稿