2023年3月1日

対話と反芻

佐々木俊尚氏のコラムから、ChatGPTの意味は「対話そのもの」にあるのではという論考。 

そのコラムでは、ChatGPTの一番の利点は、愚直に対話を続けてくれて、その結果として自分自身の考えが推敲されて必要な結論が見えてくると主張されています。ChatGPT事態AIとして情報の収集と後世に優れていることは事実何ですが、個人的に一番関心を持ち素晴らしいと感じているのは、出力される日本語の品質なんですよね。言葉の使い方や言い回しに文章構成と、本当に生身の人間が(それも優秀な人が)対応していると言われても疑問を抱かない、それ位素晴らしい日本語構成力があってこそ、ここで言われている「対話」が成立する最大の要素だと思います。英語にしても、自分が読む限りは日本語同様殆ど自然な会話としか思えないので、多分他の言語にしても同等なんだと思います。同時に、入力された日本語表現も正しく理解している訳だから、日本語解析能力もこれまで以上の性能を持っているわけで、その部分だけでも切り出して使えないかと思うくらい。

このコラムを読んでいてその「対話」の大切さを身をもって最近感じているのが、Grammalyの利用時だったりします。主に仕事で使用する英文を、相手に正しく通じるようにまた社会人として余り変で無いレベルの文章になるように、少し前から利用し始めています。流石に、論文とか大量の文章作成をしているわけでは無いので、無料での利用範囲なのでその機能は限定されています。例えば、文法的に間違っていたり推奨されないような部分にはマークが付いて、有料版だと修正候補が表示されたりするんですが、無料版だと「ここは変」と言ってくれるけれど、どの様に修正したら良いのかまでは教えてくれない。だから、自分で何が問題でどうしたらよいのか考えないといけません。一応マークアップする時に「不適切な使用例」「間違った語句」「印象が悪い」みたいな、一言コメントみたいなものが表示されるので、そこから考えて適切な語句に変更したり表記を変更したりするんですが、これが決行良い頭の体操になり、最近は癖になりつつあります(笑)。例えば私は昔からの癖で、どうしても受動態表記を多用する癖があるんですが、これは殆ど100%マークアップされます。で、能動態に直す時に、何をここでは言いたいのかと考えながら、単に主語を戻して動詞を能動態に戻すだけでは無く、それ以外の部分も修正が必要だったりします。そう言う事を繰り返していると、不思議な事に段々と受動態中心の書き方が直っていくように思います。それ以外にも、つい曖昧になりがちな前置詞の使い方とか、接続詞とか、自分で考えて修正して、マークアップが消えると「なるほどね」と勝手に自分が一歩成長したような達成感を感じたりして(笑)。

ChatGPTでの「対話」の意味も、そういう部分の要素が大きいんじゃ無いだろうか。そう言う意味では、ChatGPTで実装して欲しい機能としては、質問履歴をツリー構造で表現して、何時でも任意の質問箇所に戻って、そこから分岐して新しい質問と回答のツリー構造を増やせるような機能。例えば、Xという内容の質問に関して、ChatGPTと自分の回答-質問サイクルが「X→A1→XX→A2→XXX→A3」と続いた時、A3という結論とは別の可能性を調べたくて、ChatGPTがA1の回答をした自伝まで巻き戻して、前回の「XX」という質問では無く「XY」という質問に変更したら、以降の対話の流れが「X→A1→XY→A25→XYY→B1」見たいに、全く異なる意外な展開が生まれて、最初の流れと比較することで新しい知見が得られるかもしれない。ChatGPTがプロンプト(コマンド)型のI/Fなので、そういう使い方は想定していないのかもしれないけれど、ローカル変数みたいな形で以前の回答情報は参照出来る機能もあるみたいなので、それをそのセッション中だけでなく、後から利用出来るように保存をしておくよう事も出来れば、さらに面白い使い方も出来るんじゃ無いかと思うんですよね。例えば質問の代わりに「ここまでの対話記録を〇〇という名称で保存」と言えば、後からその名称で呼び出すことが出来るとか、有償サービスでも良いから提供してくれないだろうか。

ところで、「対話型I/F」となれば、やっぱり今のようなテキスト入力・出力形式ではなく、少なくとも入力(質問)に関しては、音声認識で出来るようにして欲しい。多分音声入力のFEPを使えば、今でも可能なんだろうけど、別アプリが入力音声をテキストに変換してそれをChatGPTに流し込む動作と、ChatGPTが音声解析をして相手の質問内容を認識する事は、結構大きな違いがあると思います。そこに、ChatGPTの出力も音声合成をして、文字通り「会話形式での対話」が可能になると、それこそベッドに寝たままで論文を作成したりとか可能になるのでは。さらに言えば、対話をして自分の認識や理解を広げたいのに、「テキスト入力」という一手間がその間に存在してしまうと、その思考が中断される事にもなる気がするんですよね。文字入力しながら考えを整理する、と言う事もあるとは思うけれど、多分多くの人は言葉をローマ字入力していくだろうから、そこで頭の中の抽象的な考えが、ローマ字という別の形態に一度変換されて言語化されていくという、ノイズが入りそうな気がする。かな入力ならば、そのノイズも少なそうだけれど、それでもかな入力から漢字変換と言う作業は避けられないわけで、そこでも思考が一時中断される事のデメリットが生まれそう。だから、やはり会話形式への拡張というのが、次のブレークスルーに成るんじゃ無いだろうか。そう言う意味では、ChatGPTの最大の魅力はその大会日本語I/Fだと思うし、使う上で一番有効な活用目的は、自分で考えて自分で答えを見つける手段の一つとして最大限に活用出来るツールだと言うことだと思います。

0 件のコメント:

コメントを投稿