外呼機器人是一種..的人工智能產品形態,而之前的外呼系統面臨著語音識別技術、多輪對話、人類的對話行為模型非常復雜等多種挑戰,那么對于現在而言,外呼機器人的市場也越來越大,除了它已經通過了各種挑戰,還有什么其他的原因呢?下面,沈陽外呼機器人公司的小編就為大家簡單介紹一下。
外呼機器人具有哪些挑戰和風險呢?
語音識別技術的挑戰,前面說到實驗室環境下語音識別準確率已經從2013年的87%提高到了2017年的97%,而在實際環境中,這個數字會降低到85%左右,因為實際環境中有大量的噪音、口音、聲源遠近等問題。
在外呼機器人這個領域,短語音識別是一個難點,因為在缺少更多上下文信息的時候,語音識別很難確定你發的音和對應的字之間的關系,中文更是如此,因為中文是一個同音不同字的語言,還有音調的變化。
來自于技術方面的第二個挑戰是多輪對話,人的自然語言從來都是含糊不清的,特別依賴上下文關系。比如說“我想訂一個房間”, “什么位置?”, “中關村附近”,“什么時間?”,“周六”… …這個例子里面,關于訂房間的信息是散落在多輪對話之間的。如何綜合全面考慮上下文信息一直是學術界的一項挑戰。
第三,人類的對話行為模型非常復雜。因為在外呼機器人場景下,人們期待的是和另一個人之間的交流而不是一臺機器。研究顯示,人們在和機器人對話的時候,會自然的放慢語速,發音會更清晰,也會用更加配合機器人的句式來交互。
但是在和人溝通的場景中,人們的發音或更含糊,會在句子中省略很多字詞,也會在句子中突然修改前面的對話信息,這些都給語音識別,語義理解造成了極大的困難。
.后,我們目前的外呼機器人大部分都還是播放提前錄音,為了實現真正的人機語音對話系統,我們需要讓機器能發出人的聲音,這就是語音合成技術。
但是要合成出人自然對話中的抑揚頓挫,并且騙過人是一件非常困難的事情,人的耳朵對于音頻的敏感程度遠超過人眼對圖像的敏感程度,這也讓語音合成這件事情的難度更高。