智能語(yǔ)音技術(shù)是人工智能應用最廣泛的技術(shù)之一,在眾多的人工智能產(chǎn)品中應用,此技術(shù)可以減少設備操作的學(xué)習成本,讓智能設備聽(tīng)懂人類(lèi)的自然語(yǔ)言從而更便捷地滿(mǎn)足用戶(hù)的需求。
智能聲學(xué)傳感器方案是一種邊緣計算的解決方案,可以解決傳統云計算模式下存在的高延遲、受限于網(wǎng)絡(luò )穩定性等問(wèn)題,將語(yǔ)音處理程序放置在靠近用戶(hù)和語(yǔ)音數據收集點(diǎn)的位置,通過(guò)本地化語(yǔ)音處理,實(shí)現離線(xiàn)語(yǔ)音喚醒及控制。由于無(wú)需聯(lián)網(wǎng),語(yǔ)音處理和反饋的時(shí)間較短,因此語(yǔ)音交互時(shí)客戶(hù)感覺(jué)不到明顯的延遲,用戶(hù)體驗較好。
歌爾微作為MEMS聲學(xué)傳感器行業(yè)龍頭企業(yè),深耕MEMS聲學(xué)傳感器新技術(shù)研究,在智能聲學(xué)傳感器技術(shù)方面取得突破,研發(fā)出了集成AI語(yǔ)音芯片的智能聲學(xué)傳感器產(chǎn)品。該產(chǎn)品是在傳統MEMS聲學(xué)傳感器基礎上引入AI語(yǔ)音芯片,將語(yǔ)音信號采集部分和語(yǔ)音信號處理單元集成在一起的新型聲學(xué)傳感器,借助于語(yǔ)音芯片強大的信號處理能力,在器件本體實(shí)現語(yǔ)音喚醒、語(yǔ)音識別、事件檢測等自主功能。該方案為應用系統提供一種靈活的低功耗集成化語(yǔ)音解決方案。
歌爾微為客戶(hù)推出的智能聲學(xué)傳感器優(yōu)點(diǎn)十分突出。其采用優(yōu)化的專(zhuān)用AI語(yǔ)音處理芯片,達到超低的運行功耗,其支持數字信號輸出的智能聲學(xué)傳感器的總體監聽(tīng)功耗小于0.5mW,達到與傳統數字式MEMS聲學(xué)傳感器相當。同時(shí),通過(guò)疊片式集成封裝技術(shù),將AI語(yǔ)音處理芯片封裝進(jìn)了聲學(xué)傳感器的內部,實(shí)現了小尺寸的效果,其集成尺寸可以達到與傳統MEMS聲學(xué)傳感器相當。MEMS聲學(xué)傳感器收集到的音頻信號無(wú)需向外部網(wǎng)絡(luò )傳遞,直接在器件本體內AI語(yǔ)音處理芯片中進(jìn)行信號處理,該本地化的處理方式使語(yǔ)音交互的延遲降低到0.5s之內,大大提升了用戶(hù)體驗。
其采用了AI語(yǔ)料訓練的技術(shù),語(yǔ)音命令的識別率高。
語(yǔ)音交互是人與人之間最自然的交互方式,其使用的門(mén)檻低,幾乎不需要額外學(xué)習,也不需要設置額外的遙控器,可以解放雙手進(jìn)行遠距離、無(wú)接觸式的控制,這在設備的控制應用上具有天然的優(yōu)勢。尤其在全球疫情的背景之下,非接觸式的控制更是一種較為安全選擇。在智能設備的語(yǔ)音喚醒或命令的應用中,命令詞可根據客戶(hù)的需求進(jìn)行訓練,識別率可達到95%及以上,誤識別指標可達到≤2次/24H??梢詮V泛適用于燈具、空調、風(fēng)扇等智能家電設備,TWS、智能手表、VR/AR等穿戴設備,以及其它需要長(cháng)時(shí)間、低功耗待機等待喚醒或命令的設備。
除了實(shí)現語(yǔ)音喚醒、語(yǔ)音命令之外,智能聲學(xué)傳感器還可以通過(guò)語(yǔ)料的訓練實(shí)現多種聲音事件的探測。比如,可識別嬰兒啼哭的聲音、玻璃破碎的聲音、特定呼救的聲音、警笛報警的聲音、以及其它具有特征的聲音。在此模式下,智能聲學(xué)傳感器可以很簡(jiǎn)單地讓用戶(hù)的設備具備兒童看護、危險事件警報、聲音防盜、治安監控等智能功能。