WT2605-24SS音頻解碼語(yǔ)音芯片,實(shí)現寵物(玩具)喂食器遠程更新語(yǔ)音技術(shù)方案解析
本文主要介紹一種遠程更新語(yǔ)音技術(shù)的實(shí)現方式,在一些產(chǎn)品應用上,常常會(huì )遇到一些需要不停更換語(yǔ)音的場(chǎng)景(如寵物喂食器、寵物玩具需要經(jīng)常更換聲音,充電樁設備需要更換提示語(yǔ)等等),市面上常用的一些語(yǔ)音芯片大多都無(wú)法直接更換語(yǔ)音內容,因此會(huì )存在一些無(wú)法避免的痛點(diǎn),有些產(chǎn)品會(huì )使用流媒體功能的芯片去播放,但是往往也伴隨著(zhù)巨大的流量消耗以及網(wǎng)絡(luò )傳輸延遲,播放卡頓等現象,本文介紹的這一技術(shù)可降低對流量的消耗,下面著(zhù)重介紹如何實(shí)現遠程更新語(yǔ)音這一技術(shù)。

一、系統組成
1、音頻語(yǔ)音芯片參數介紹
該技術(shù)主要通過(guò)WiFi/4G模塊與一款音頻解碼芯片(WT2605-24SS)實(shí)現,音頻解碼芯片能夠實(shí)現語(yǔ)音的更新以及存儲,WT2605-24SS這款音頻解碼芯片的參數如下:
1)帶有DSP指令的32-bit高性能CPU。
2)16 bit DAC音頻解碼器,高達96dB的SNR。
3)支持音頻均衡器調整。
4)1個(gè)SPI。
5)1個(gè)IR控制器。
6)1個(gè)SD卡主機控制器。
7)1個(gè)全速USB2.0 HOST/DEVICE 控制器。
8)一個(gè)全雙工UART,通訊速率高達1Mbps,主要通過(guò)該接口與外部器件進(jìn)行交互。
1.1、DAC參數介紹:
DAC對音頻芯片來(lái)說(shuō)是一個(gè)很重要的參數,此款語(yǔ)音芯片具有16bit 的DAC,也就是DAC的轉換精度能夠達到2的16次方,精度越高,音頻播放的還原度也就越高,當然也有24bit DAC的音頻芯片,這類(lèi)芯片的價(jià)格比較高,一般用于高端的消費類(lèi)電子產(chǎn)品,如HIFI音響等。大部分產(chǎn)品使用16bit的DAC已經(jīng)足夠,性?xún)r(jià)比較高,當然市面上的音頻芯片DAC特性參差不齊,有9bit,11bit,13bit的DAC,這類(lèi)芯片的解碼通常都依靠軟件解碼的方式去處理,一般音頻文件大部分都是16bit,將16bit的音頻文件通過(guò)軟解碼的方式轉為9bit,11bit或13bit的音頻播放,效果可想而知。16bit的DAC直接通過(guò)硬件解碼16bit的音頻才能夠達到最好的效果。
對于SNR,一般能夠達到90db的信噪比已經(jīng)有不俗的音質(zhì)表現,此款I(lǐng)C高達96db的SNR,音質(zhì)將會(huì )表現更加出色。
1.2、音頻格式介紹:
此款芯片主要支持mp3格式,當然也支持WAV,flac,ape等音頻格式播放,一般主要推薦使用mp3格式音頻,這類(lèi)音頻資源較多,文件容量較小,大部分場(chǎng)景都能夠滿(mǎn)足,比較通用,WAV,flac,ape等都是無(wú)損音頻格式,文件容量都比較大,不太適用于語(yǔ)音更新的場(chǎng)景。
1.3、語(yǔ)音合成介紹:
對于提示語(yǔ)音,一般可以通過(guò)文字合成語(yǔ)音的方式處理,如下:
?
我們將語(yǔ)音下載下來(lái),用Adobe audition軟件打開(kāi)音頻看下音頻文件信息:
?
可以看到合成出來(lái)的是16k,16bit的mp3音頻文件,對于一些應用場(chǎng)景,語(yǔ)音合成直接在服務(wù)器端處理即可,這里不做過(guò)多介紹。
?2、系統框圖介紹:
?
上圖介紹了遠程語(yǔ)音更新的具體實(shí)現方式,主要由4G/WiFi設備連接到服務(wù)器,通過(guò)服務(wù)器把音頻數據下發(fā),經(jīng)過(guò)4G/WiFi設備中轉傳輸到WT2605組件進(jìn)行保存,文件由WT2605語(yǔ)音芯片組件進(jìn)行統一管理,更新完成后可直接控制設備下發(fā)指令進(jìn)行播放。這樣實(shí)現了語(yǔ)音的更新操作,流量也只消耗在音頻數據的傳輸上,相比流媒體播放的方式減少了流量消耗,播放卡頓等現象。
?
二、電路設計
1、WT2605與WiFi模塊電路
2、上述電路以WiFi模塊作為主控,WiFi模塊獲取服務(wù)器端下發(fā)的音頻數據,再通過(guò)UART串口傳輸到WT2605芯片進(jìn)行保存,傳輸完成后直接發(fā)送相關(guān)指令即可控制播放。電路設計非常簡(jiǎn)單。
?
WiFi模塊通過(guò)指令,控制WT2605解碼存儲在SPI FLash的音頻數據,經(jīng)過(guò)LM4890功放后播放。這里以1W的功放作為演示,調節R6,R7,R8可調整功放的增益,其他功放根據具體的芯片手冊進(jìn)行設計。
三、通訊命令格式介紹
通信協(xié)議主要定義主控和?WT2605之間的交互規則,處理器如何將數據推送給WT2605進(jìn)行相應的處理,WT2605反饋相應的處理結果。通信數據主要以命令幀的方式進(jìn)行,一個(gè)有效的命令幀必須包含:幀頭,命令包長(cháng),命令包,校驗碼,幀尾等五部分。

幀頭由1個(gè)固定的十六進(jìn)制數據表示,幀類(lèi)型包含下傳命令幀(模組接收的命令幀)以及上傳命令幀(模組接收數據后反饋的命令幀,即ACK或NAK)。
命令包長(cháng)表示命令幀除幀頭和幀尾外的字節數,即命令包長(cháng)(1字節)+命令包(N字節)+校驗碼(1字節)= N+2?字節。
命令包是具體的命令,主要包含:命令+參數。
校驗碼,為命令包長(cháng)+命令包的和。

WT2605-24SS語(yǔ)音芯片典型應用場(chǎng)景:
1)寵物喂食器、寵物玩具;
2)掃地機;
3)充電樁;
4)語(yǔ)音廣告機;
5)共享自行車(chē)、充電寶等。
?唯創(chuàng )知音作為一家專(zhuān)注于語(yǔ)音技術(shù)研究的高新技術(shù)企業(yè),始終堅持以“服務(wù)好工程師”
為目標,以行業(yè)語(yǔ)音交互器件標準化為方向,致力于讓復雜變簡(jiǎn)單,提供快捷的語(yǔ)音、智能
物聯(lián)網(wǎng)應用解決方案。