忍者ブログ

リリースコンテナ第3倉庫



Home > ブログ > > [PR] Home > ブログ > 未選択 > KDDI研究所、日本語音声合成ソフト「N2」の新バージョンを提供開始

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

KDDI研究所、日本語音声合成ソフト「N2」の新バージョンを提供開始

日本語音声合成ソフトウェア「N2」の新バージョンを11月15日より提供開始
再現可能な音の帯域を従来の2倍に拡大
より自然でクリアな音声合成が可能に


 株式会社KDDI研究所は、日本語音声合成ソフトウェア「N2(エヌツー)」の出力のサンプリング周波数(*1)を、従来の16kHzから32kHzに変更し、合成音声の再生帯域を2倍に拡大しました。これにより、より自然でクリアな音声の合成を可能としました。さらに、KDDI研究所が独自に考案したアルゴリズム(*2)により、倍のサンプリング周波数でありながら、従来よりもさらに高速な音声合成処理を実現しています。新バージョンの提供は2013年11月15日(金)より開始します。

【日本語音声合成ソフトウェア「N2」について】
 2011年より、日本語音声合成ソフトウェア「N2」TTSライブラリ(Android版)およびAndroid向け日本語TTSアドオン「N2 TTS」を、また2013年より、TTSライブラリのiOS版の提供を開始しました。HMM音声合成方式(*3)により携帯端末上での合成に必要な高速・省サイズを実現し、KDDIのサービス「おはなしアシスタント」やタクシーの配車システムなどでご利用いただいてきました。

【新バージョンの主な特長】
 1.サンプリング周波数を32kHzに変更。
 ・再生帯域を2倍に拡大。実用レベルで必要な、音声の周波数帯をカバーしたことで、より自然でクリアな音声合成が可能に。
 2.高速処理の実現
 ・独自アルゴリズムを開発し、従来版よりも高速な音声合成処理を実現。

【提供方法、仕様】
 2013年11月15日(金)


 ・参考資料は、添付の関連資料を参照


以上


 ※「Android」はGoogle Inc.の商標または登録商標です。
 ※iOS商標は、米国Ciscoのライセンスに基づき使用されています。
 ※Xcodeは、米国およびその他の国で登録されたApple Inc.の商標です。



【用語説明】
 *1:サンプリング周波数:
 音声等のアナログ波形をデジタルデータにするために必要な、標本化(サンプリング)と呼ばれる処理をする際の頻度(1秒当たりのサンプリング回数、単位Hz)のこと。ある音を正確に記録し、再現するためには、その音の周波数の倍以上の周波数でサンプリングする必要があります。(例えば32kHzサンプリングでは、16kHzの音声成分までが音として再現可能。)一方で、サンプリング周波数を上げると、データの量が増え、より多くの計算処理が必要となります。

 *2:独自アルゴリズム:
 従来のバージョンでは、HMM音声合成方式による他の多くのシステムと同様に、インパルス列をフィルタに通すことで音声波形を合成していました。これに対して新バージョンでは、音声を32個の等間隔の周波数帯域に分けて考え、それぞれの帯域で正弦波を組み合わせて波形を合成しています。標本化定理に基づき、各帯域では出力の1/32のサンプリング周波数で処理を行えるため、計算処理を大幅に削減できます。この方法では、帯域毎に合成された波形を1つにまとめるための計算処理が最終的に必要ですが、その処理を含めてなお、従来の手法よりも高速な処理が可能です。

 *3:HMM音声合成方式:
 統計的な音声モデルを用いる音声合成方法。従来の音声波形をつなぎ合わせて合成音声を生成する方法と比較し、品質を高く保ちながら必要なデータサイズを抑えることができます。
PR

Comment0 Comment

Comment Form

  • お名前name
  • タイトルtitle
  • メールアドレスmail address
  • URLurl
  • コメントcomment
  • パスワードpassword