2025年6月12日

AI対決

PC Watchの特集記事から、Microsoftの「Copilot+ PC」と、Appleの「Apple Inteligence」のAI対決。どちらのAIも一長一短有り、どちらが優れている・劣っているとは言い難いのだろうけど、まだまだAIの「ぇ」の字すら体験していない自分にとっては、「ふぅぅぅぅぅん」みたいな印象の記事。

自分も生成AIには興味が有るし、何とかして有効利用出来ないかと考えてはいるけれど、中々実際に手にして体験してみるところまで行かない。ChatGPTが登場した時には、何度かプロンプトを開けてその機能や性能を試してみて感心したけれど、結局はそれ以降は殆ど手にすること無く関連記事だけ読みあさって傾向だけは把握するようにしていくのが精一杯。もう少し身近な存在便利機能として活用してみたいのだけれど、中々手が伸びない理由は何かと思って見たんですが、この記事を読んでいて感じたのが「いろいろ生成AIの活用方法は記事や特集で公開されるけれど、自分が欲している部分にジャストミートするような内容が殆ど無い」事では無いかと言うこと。例えば最初の実例では、不要部分の削除機能を紹介していて、これはPhotoShopをよく利用している自分にとっても便利そうな機能なんですが、やはり限界はあるんですよね。記事のように小さなサイズで見る分には全く問題無いように見えるんですが、やはり細部を見るとレタッチは必須だし、それが逆に面倒な処理になったりするんですよね。Googleの「消しゴムマジック」も試してみたことはあるんですが、やはりそれなり。

続く機能の中では、文字起こし機能は便利そう。最近の文字認識機能はかなり信用できて、殆ど人間が聞いて入力した文章と遜色ない文字起こしをしてくれますが、逆に殆ど精確なんだけれど、地雷のように見逃しそうな所に誤訳や誤植が残っているのに気がつかず、後から読み返してみたら何か文章が通じなくて、よくよく聞き直してみたら文字起こしのミスだった、みたいな事があるんですよね。日本語の文章の場合、句読点の打ち方一つで意味が180度かわったりしますが、そういう部分も気になるところ。人間が聞いて文字起こしする場合には、その前後の文脈だとか、声の抑揚なんかである程度判断も出来ますが、今のAIだとそこまではまだ到達していない。ネットで時々騒動の基になる、「切り抜き」「切り貼り」みたいな事が発生してしまう。結局はもう一度自分でオリジナルの音源を聞き直して理解する事が必要で、文書で何からのレポート作成が必要な場合には、文字起こしは入力作業の軽減にはなるけれど、逆に較正作業で大変かもしれない。

何度も書いていますが、私が欲しいなと思う生成AIは対話型で自然学習してくれるようなタイプ。特に意図的にプロンプト入力しなくても、日々の会話なりをモニターして自然学習してくれたらベスト。でも、例えば仕事をしているときには私は静かに作業する方で、独り言も殆ど言わない。となると、生成AIとしても何を入力として処理していいのか困るでしょうね。カメラ越しに表情をモニターして何かを感じる、というのは流石にまだまだ難しいだろうし。あと、色々な生成AIを試してみたいけれど、自分の学習済みデータが共有出来ないから基本最初からもう一度やり直さないといけない。それこそ自分専用の「コアメモリー」みたいなものがあって、そこに各生成AI固有のパラメーターを積み上げていくようなことが出来たら便利だし有効だと思うけど、難しいのかなぁ。今の生成AIは、多分「エージェント」みたいな言い方があっていると思うんですが、自分が欲しいのは「バディ」と呼べるような存在の生成AI。突然シンギュラリティに到達して一気に世界が広がるのか、自分が生きている間に経験してみたい光景ですよね。

0 件のコメント:

コメントを投稿