2 26, 2003
Voice と Moblog

さて、CNET Japan でも取り上げられている、オーディオ Moblogのビジネスの可能性を、考えてみよう。

この記事でも指摘されている通り、ノイズ対策も重要だが、もう一つ大切なのは
Voice to text の変換機能をどこまで高められるか、にもある様な気がしている。音声で聴く Blog も語り手の感情の起伏が声で伝わり、携帯電話からでも手軽に Entry が出来て良いのだが、自分の素の声を直接 Blog に Upload することにプライバシー上抵抗がある人も多いと思われる。音声だと、テキストと比較して情報を聴く側にとっても、情報を理解する実時間をそれなりに食われることになり、非効率でもあるかもしれない。ビデオの早送りの様に、音声メッセージをある程度短時間で聴くことが出来る技術は使えるにしても、読むスピードにはかなわないはず。

学習無しでは完璧な認識はまだ難しく、実用アプリケーションがまだまだ少ない音声認識技術だが、Moblog での利用は実需があるはず。最近 Moblog 頻度を上げたので、歩きながら短文テキスト入力を携帯電話から行う機会が多くなったが、さすがに安全上の問題がある。音声認識のテキスト変換機能は、歩きながら Moblogger としては、是非欲しい。

RICOH の最新カメラでは、 PC ソフト側で搭載された、音声認識機能との連携で、撮影した写真の内容を音声→テキストに変換して保存することが可能となっている。これと同じく、携帯端末側へ認識の機能を入れる必要は無く、テキスト認識や雑音の除去はネットワークの Server 側で行えば良い。このあたりの Tool が揃うと、Moblog はさらにマスへの普及を狙えることになる。Moblog + 音声→テキスト変換アノテーション。この機能が揃うと、Moblog はさらに面白くなる。

Posted by minami at 2 26, 2003 11:24 AM