思必馳于業(yè)內(nèi)率先推出多輪對話、可糾正可打斷的認(rèn)知智能、實時轉(zhuǎn)錄的語音輸入板、環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列、AIOS-思必馳對話操作系統(tǒng),是國內(nèi)唯一擁有人機(jī)對話技術(shù),國際上極少數(shù)擁有自主產(chǎn)權(quán)、中英文綜合語音技術(shù)(語音識別、語音合成、自然語言理解、聲紋識別、性別及年齡識別、情緒識別等)的公司之一。
“環(huán)形六麥陣列”人性化的語音交互技術(shù)
環(huán)形六麥陣列是在“環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列”基礎(chǔ)上全面升級的一項語音交互技術(shù)。主要針對智能家居和智能機(jī)器人提出的軟硬一體化解決方案。支持回聲消除、聲源定位、波束成形、語音增強(qiáng)等功能。同時,思必馳提供云端第三方內(nèi)容服務(wù),讓大數(shù)據(jù)精準(zhǔn)服務(wù)于智能語音領(lǐng)域。
1、語音增強(qiáng):
解決噪聲環(huán)境下的識別問題需要從抑制噪聲和語音增強(qiáng)兩方面入手。思必馳環(huán)形六麥陣列利用拾音波束成形,采用獨(dú)特算法,有效抑制波束之外的噪聲,同時融合語音信號的空時信息,從含噪聲的語音信號中提取出純凈語音,有效地增強(qiáng)說話人語音。
2、聲源定位:
思必馳環(huán)形六麥陣列實現(xiàn)360°環(huán)形拾音,多麥定向,準(zhǔn)確計算目標(biāo)說話人的角度和距離,實現(xiàn)對目標(biāo)說話人的跟蹤以及語音定向拾取,精準(zhǔn)度控制在±10°以內(nèi)。聲源定位功能不限制說話人運(yùn)動,不需要移位操作,這增強(qiáng)了產(chǎn)品設(shè)計的靈活性和功能的多樣性,可有效地實現(xiàn)對產(chǎn)品的多功能輔助作用。
3、遠(yuǎn)場交互:
思必馳環(huán)形六麥陣列在前端充分利用其空域濾波特性,抑制拾音波束外的回聲、混響等噪聲,進(jìn)行語音增強(qiáng)處理,輔之以語音識別引擎的二次處理,實現(xiàn)優(yōu)質(zhì)的遠(yuǎn)場識別交互。思必馳已實現(xiàn)了國內(nèi)領(lǐng)先的5米遠(yuǎn)場交互,5米、3米、1米識別率分別為92%, 94%, 96%以上,遠(yuǎn)場識別媲美近講。
4、打斷糾錯:
思必馳環(huán)形六麥陣列融入了自適應(yīng)、理解糾錯、智能反饋等認(rèn)知技術(shù),重新提取大數(shù)據(jù)因素,并進(jìn)行二次計算,實現(xiàn)智能糾正打斷,能夠適應(yīng)更多的應(yīng)用環(huán)境,具有進(jìn)化調(diào)整功能,從而在人機(jī)交互的過程中,使機(jī)器更“聽話”。
5、多輪對話:
基于對話邏輯,允許人機(jī)進(jìn)行多輪語音互動,讓機(jī)器理解用戶的深層意圖并提供反饋。而機(jī)器可以通過深度學(xué)習(xí),可以根據(jù)上下文語境準(zhǔn)確追蹤用戶意圖,并隨著數(shù)據(jù)的積累而越發(fā)靈活精準(zhǔn)流暢。
6、后端服務(wù):
目前思必馳環(huán)形六麥陣列解決方案整合了高德地圖、酷我音樂、蝦米音樂、喜馬拉雅電臺、考拉電臺、大眾點評等生活服務(wù)方面的諸多關(guān)鍵資源,致力將智能語音服務(wù)整合成一體化產(chǎn)品,打造體驗閉環(huán),形成完整的生態(tài)鏈。
環(huán)形六麥陣列推動了智能機(jī)器人、智能家居等領(lǐng)域便捷化的發(fā)展,淘汰按鍵、遙控器、APP等控制終端,實現(xiàn)純語音控制的未來便捷生活。促進(jìn)了智能語音交互技術(shù)的發(fā)展,有利于未來智能人機(jī)交互的多模態(tài)結(jié)合和人工智能整個行業(yè)的發(fā)展。