音声対話システムにおいて人間らしい自然な対話を可能にする技術です。HEARTalk™は、人間同士の会話の「韻律」を参考にして生まれました。機械応答の不自然さを解消する、これまでに無い新たな技術です。

対話の「韻律」を合わせる技術

韻律とは、声の強弱、長短、高低、間、抑揚などから構成されます。人間同士の会話ではこの韻律の調和が非常に重要であり、逆に韻律を意識しない対話システムでは不自然な会話となってしまう問題点が有ります。

対話型I/Fの基礎技術になり得る原理・技術

対話システムでの応用例を述べます。対話システムの内部の音声認識処理は通常クラウド上にあり、かつその処理量が多いため、音声認識後の音声合成(TTS)による返答に時間を要します。
一方、HEARTalk™は人間の発話内容の解析は行わず、韻律の解析処理のみであるため、少ない処理量で軽快に動作します。
そのHEARTalkを下図のように音声認識と並列に置き、音声認識する前に適切な間と音程で返答を返すことで、対話ユーザが抱く違和感を劇的に改善します。
弊社ヤマハからお客様である対話ベンダー様に提供する形態、即ちビジネスモデルについては、個別に相談に応じています。