先日アップデートされたiOS 5.1からSiriなど音声認識機能で、正式に日本語が使用できるようになった。Siriは音声で質問などをすると、それに答えてくれるバーチャルアシスタントだが、iPhone 4Sには音声を認識して文字入力する機能もある。Siriでの音声認識も、ある程度の認識精度があるが、同じエンジンを使用していると思われる音声による文字入力の精度も比較的高い。

音声入力機能、文字入力のソフトウェアキーボードの画面のスペースキーの左横にマイクボタンが表示され、このマイクを押すことで使える。句読点は「てん」「まる」、改行は「改行」と音声入力中に発言することで、入力可能だ。

認識精度は、理路整然とした文章を話せばおおむね問題はない。精度が下がるのは言い間違いをしたり、はっきりとしない話し方をした場合だ。また、固有名詞など、あまり一般的ではない日本語でもあまり認識精度は高くない。そうは言っても日常会話程度ならほぼ問題なく使えるので、かなり優秀だと見ていい。


日本語の音声入力を試す iPhone4S

■音声入力はどれだけ実用的か

「今駅に着きました、改札の前で待っています」

のような、簡単な文章は約6秒程度で正しく入力された。筆者がiPhoneのソフトウェアキーボードで予測変換を使わず入力する場合、15秒程度はかかる。PCのキーボードの場合で8秒程度。つまりiPhoneの場合、口頭で入力した方が圧倒的に速いということになる。

音声入力後、認識自体に2秒程度かかかるが、それを含めてもPCのキーボードで入力するのと同等だ。ソフトウェアキーボードに比べれば、圧倒的に速く入力ができる。文字入力の速度は人によって異なるが、相当速い人以外は、ソフトウェアキーボードよりも音声入力の方が速いだろう。もちろん、誤認識による修正を含めればこの条件もかなり変わってくるが、ちょっとした日常会話では、この音声入力はかなり実用になる。

■日本で音声入力はできるか?
日本において電車の車内では、なるべくおとなしく静かにしているのがマナーだ。このような環境では、音声入力をするには、かなりの勇気がいる。諸外国では、Bluetoothのヘッドセットが一般的に使われ、電話などの会話もハンズフリーが珍しくない。そのような国では、道を歩いているときに独り言のように電話で会話している人もかなり多いが、日本でそうした音声入力を使うと単なる変人にとられかねない。

この音声入力は第3世代iPadでも使用できるようになるが、当面は使う場所を選ぶだろう。このように音声入力機能を使う場所に注意を払う必要はあるが、これだけ使えれば音声コントロールや認識など、様々な場面で一般的になっていくことは確実だろう。

上倉賢 @kamikura [digi2(デジ通)]

digi2は「デジタル通」の略です。現在のデジタル機器は使いこなしが難しくなっています。
皆さんがデジタル機器の「通」に近づくための情報を、皆さんよりすこし通な執筆陣が提供します。

デジ通の記事をもっと見る
サービス終了後はどうなる!電子書籍は永遠に読めるのか
キンドルが日本に参入する?Amazonの電子書籍をおさらい
iPhoneが据え置きゲーム機も殺す?多機能化するスマートフォン
OSが変わっても使い勝手は同じ!ハイブリッドPCの今後は?
まるでお祭りの出荷式!レッツノートSX1の出荷が始まる


【キヤノン純正インク】キャノンインクタンク 5色マルチパック BCI-321+320/5MP【キヤノン純正インク】キャノンインクタンク 5色マルチパック BCI-321+320/5MP
キヤノン
販売元:Amazon.co.jp
クチコミを見る