このサイトのメインメニュー

音声認識のしくみ

ユーザの発声内容を認識し、文字列に変換することを「音声認識」といいます。

音声認識アルゴリズムの改良とコンピュータ技術の革新により、近年になって実用的な時間で音声認識処理を行うことが可能になりました。コンピュータがユーザの発声を聞き取ることができるため、音声という人間にとって自然なインターフェースでコンピュータを操作することも可能になりました。
現在、音声応答振り分けサービスやボイスポータル、株価案内、各種注文受付などの自動応答サービスでおもに利用されておりますが、今後さまざまな分野での利用が期待されています。

音声認識のしくみ

音声認識を行うためには、「音響モデル」と「認識辞書」が必要です。
音響モデルには、人間の発声の小さな単位(音素)の音響特徴が記述されており、認識辞書には音声認識させることばが記述されています。

音声認識は、以下のような処理が行われます。
(1)入力された音声を分析し、音響特徴を算出します。
(2)認識辞書に記述されていることばの中から、ことばの音響特徴が入力音声の音響特徴に最も近いことばを探して音声認識結果として出力します。

これまでの音声認識では、人間の自由な発話を一語一句認識することは難しく、認識することばを記述した認識辞書を持っているのが一般的でした。
自由発話対応の音声認識エンジン「SpeechRec」では、上記の音声認識技術に加え、実例を数多く集めた言語モデルや発話理解技術、対話制御技術などを駆使して、人間の自由な発話を高精度に認識し発話を理解できるようになりました。電話回線、IP電話、インターネット、直接対話など多様な利用環境下で、子供から高齢者までさまざまな不特定の話者が自由なタイミングで、自由な言い方で話しても発話を認識することが可能です。

「SpeechRec」は、お客様に最適な音声認識ソリューションをご提供いたします。

  • 「SpeechRec」は、CTIシステムをはじめ多くのシステム・サービスでの導入実績があります。豊富な経験とノウハウを持っておりますので、音声認識アプリケーションに関する高い技術力とスキルをご提供することができます。
  • NTTアイティの音声技術者は単なるアプリケーション技術者ではありません。お客様にとって最も適した利用方法のご提案はもちろん、音声認識アプリケーションの各パラメータ設定やタスクの設定方法などについても、豊富な経験と技術力により安心してお任せいただけるサポート体制を持っています。
このページのTOPに戻る