NTTアイティ、スマホなどで利用できる高精度なクラウド型音声認識サービスを提供開始

スマホやタブレット等で簡単・高精度な音声認識が利用できる
クラウド型音声認識サービス「SpeechRec　Cloud」を提供開始
～音声認識を活用したアプリケーション開発をより簡単に実現～

　NTTアイティ株式会社（本社：横浜市中区、代表取締役社長：長谷雅彦）は、スマホやタブレット等で簡単・高精度な音声認識が利用できる「SpeechRec　Cloud」を、９月２４日（火）より提供開始いたします。
　「SpeechRec　Cloud」は、従来のオンプレミス型の「SpeechRec」を、スマホやタブレット等からより簡単にご利用いただくため、新たにクラウド型サービスとして開発したものです。従来のオンプレミス型と比べ、短期間かつ低コストでご利用いただくことが可能となります。
　「SpeechRec　Cloud」は、音声認識エンジンとして、WFST音声認識技術（※１）を駆使してNTT研究所が新たに開発した高速・高精度の音声認識エンジン「VoiceRex」を搭載しています。また、背景雑音の抑圧や音声データのエンコードなど、音声認識を利用する上で必要となる機能を搭載したクライアントライブラリもご用意しています。クライアントライブラリのご利用により、高性能な音声認識を利用するアプリケーション開発を、より簡単に行うことが可能となります。
　本サービスは、「Human　Sensing　２０１３」（１０月２３日－２５日、パシフィコ横浜）、「コールセンター／CRMデモ＆コンファレンス２０１３　in東京」（１１月１４日－１５日、池袋サンシャインシティ・コンベンションセンター）に出展いたします。

　※１　WFST音声認識技術：重み付き有限状態トランスデューサ（WFST：Weighted　Finite－State　Transducer）音声認識技術は、従来の個別モデル（音響モデル、単語発音モデル、言語モデル）を統合・最適化した変換モデルによる音声認識技術で、超大語彙の環境で高速かつ高精度音声認識が可能となります。

■販売開始の経緯
　これまで、音声認識の活用は、大規模なコールセンタでの通話録音音声の認識分野など、オンプレミス型での利用が中心となっており、「SpeechRec」も、コールセンタやIVRなどの分野に導入されてきました。
　近年、スマホやタブレット等の普及により、音声認識を活用したさまざまなアプリケーションが登場し、音声認識は身近なインタフェースとして認知されるようになってきました。
　今回サービスを開始する「SpeechRec　Cloud」は、もっと簡単に、かつ低コストで音声認識を利用したいというお客様からのご要望にお応えし、「SpeechRec」をクラウドサービスとして提供するものです。

■「SpeechRec　Cloud」の概要
　「SpeechRec　Cloud」の概要を図１に示します。
　「SpeechRec　Server」にインターネットを介して音声データを送ることにより、リアルタイムで音声認識結果のテキストデータを受け取ることができます。音声データの送信やテキストデータの受信などの処理は、APIを介して簡単に行うことができます。さらに、音声認識の効果を導入検討の段階で検討することができるお試し環境もご用意しています。

■「SpeechRec　Cloud」の特徴

（１）最先端のWFST音声認識エンジンを搭載
　「SpeechRec　Cloud」は、最先端のWFST音声認識技術を駆使してNTT研究所が新たに開発した超高速・高精度の音声認識エンジン「VoiceRex」を搭載しています。これにより、数百万語に及ぶ超大語彙に対しても高速かつ高精度の音声認識が可能となります。

（２）音声認識の利用形態に合わせた２種類のサービス種別を提供
　リアルタイム性や利用頻度といった利用形態に合わせて、「同時接続数保証型」と「ベストエフォート型」の２種類のサービス種別をご提供します。

（３）音声認識に必要な基本的な処理をまとめたクラアントライブラリを提供
　音声認識を利用するためには、周囲雑音を抑圧する処理、端末のマイクの制御、音声データ送信のためのエンコード処理など複雑な処理が必要となります。これらの基本的な機能を簡単に利用できるクライアントライブラリをご提供します。

■「SpeechRec　Cloud」サービス種別

（１）同時接続数保証型
　●「SpeechRec　Server」のプロセス数（同時に認識処理を実行できる数）単位でご契約いただけます。
　●リアルタイムの認識が必要で、常時利用が見込める用途に適しています。
　●音声認識エンジンで使用する辞書は、ご要望により専用の辞書として固有名詞等を登録することも可能です。（オプション）
　●利用例：スマホやタブレットのテキスト入力に音声認識を利用する場合、スマホのリモコンアプリを音声認識で利用する場合など。

（２）ベストエフォート型
　●「SpeechRec　Server」のプロセスを複数のユーザで共有するサービスです。ユーザ数単位でご契約いただけます。
　●リアルタイム性はそれほど重要でなく、１ユーザ単位で低コストに利用したい用途に適しています。
　●音声認識エンジンで使用する辞書は共用のものを利用します。
　●利用例：会話を録音したファイルを音声認識でテキスト化したい場合など。

※参考図・クライアントライブラリの概要などは、添付の関連資料を参照

　「SpeechRec(R)」は、NTTアイティの登録商標です。
　その他の商品名は、各社の商標または登録商標です。

リリースコンテナ第3倉庫

[PR]

NTTアイティ、スマホなどで利用できる高精度なクラウド型音声認識サービスを提供開始

Comment0 Comment

Comment Form