2024年3月2日發(作者:乞丐頭像)

維普資訊
第27卷第2期 彈箭與制導學報 ?26l ? 武器聲控系統的設計與實現 馬龍華,郝燕玲,上官偉,劉利強?。ü枮I工程大學自動化學院.哈爾濱 150001) [摘要]系統采用了語音端點檢測技術成功地檢測到操作員語音的起始點;并利用自動增益技術和動態時間 歸整技術對語音命令進行識別,成功地識別出操作員的武器控制命令。武器聲控控制系統采用了VxWorks 嵌入式實時操作系統.保證了系統的響應速度。模擬仿真的結果表明武器聲控控制系統能夠大大減輕武器操 作的復雜程度,降低誤操作率。并極大地提高作戰效率。?。坳P鍵詞]聲控制;自動增益;端點檢測;動態時間規整;嵌人式實時操作系統?。壑袌D分類號]TP18?。畚墨I標志碼]A?。模澹螅椋纾睢。幔睿洹。遥澹幔欤椋幔簦椋铮睢。铮妗。樱穑澹澹悖琛悖铮睿簦颍铮臁。祝澹幔穑铮睢。樱螅簦澹怼。停痢。蹋铮睿纾瑁酰幔龋粒ǎ伲幔睿欤椋睿?,SHANG?。牵眨粒巍。祝澹椋蹋桑铡。蹋椤瘢椋幔睿纭。ǎ茫铮欤欤澹纾濉。铮妗。粒酰簦铮恚幔簦椋铮睿龋幔颍猓椋睢。牛睿纾椋睿澹澹颍椋睿纭。眨睿椋觯澹颍螅椋簦龋幔颍猓椋睢。保担埃埃埃保茫瑁椋睿幔。粒猓螅簦颍幔悖簦海牛睿洌穑铮椋睿簟。洌澹簦澹悖簦椋铮睢。簦澹悖瑁睿铮欤铮纾。鳎幔蟆。幔洌铮穑簦澹洹。螅酰悖悖澹螅螅妫酰欤欤。簦稀。妫椋睿洹。簦瑁濉。铮穑澹颍幔簦铮颉印。螅穑澹澹悖琛。澹睿洌穑铮椋睿簦粒妫簦澹颉。簦瑁幔簟。螅穑澹澹悖琛。穑幔螅蟆。簦瑁颍铮酰纾琛。洌睿幔恚椋恪。簦椋恚濉。鳎幔颍稹。恚铮洌酰欤濉#簦瑁濉。螅螅簦澹怼。颍澹悖铮纾睿椋澹洹。铮穑澹颍幔簦铮颍В蟆。铮颍洌澹颉。螅酰悖悖澹螅螅妫酰欤欤希酰颉。铮穑澹颍幔簦濉。螅蟆。簦澹怼。鳎幔蟆。郑祝铮颍耄螅椋簟。鳎幔蟆。帷。澹恚猓澹洌洌澹洹。颍澹幔臁簦椋恚濉。螅螅簦澹恚幔睿洹。悖铮酰欤洹。颍澹螅穑铮睿洹。簦瑁濉。铮颍洌澹颉。椋睢。簦椋恚澹樱椋恚酰欤幔簦椋铮睢。椋睿洌椋悖幔簦澹洹。簦瑁幔簟。螅穑澹澹悖琛悖铮睿簦颍铮欤欤澹洹。鳎澹幔穑铮睢。螅螅簦澹怼。悖铮酰欤洹。洌澹悖颍澹幔螅濉。簦瑁濉。悖铮恚穑欤澹椋簦。幔睿洹。恚椋螅簦幔耄濉。铮妗。铮穑澹颍幔簦椋铮睿幔睿洹。椋恚穑颍铮觯濉。澹妫妫椋悖椋澹睿悖。耍澹。鳎铮颍洌螅海螅穑澹澹悖琛悖铮睿簦颍铮?;auto?。纾幔椋?;endpoint?。洌澹簦澹悖簦椋铮睿唬洌睿幔恚椋恪。簦椋恚濉。鳎幔颍穑椋睿纾唬澹恚猓澹洌洌澹洹。颍澹幔臁簦椋恚濉。螅螅簦澹怼≡~條信號所對應的含義。數字化的語音信號首 1 引言 先要進行端點檢測,找出語音的開始點與結束 操作人員在作戰時操控武器系統的時候是 點。將這兩點之間的數據進行增益調整后進行 非常緊張的,很容易產生誤操作。導致嚴重的后 美爾刻度倒譜系數(MFCC)變換取得特征系數, 果。如果采用聲控控制這樣的問題就會得到大 并由動態時間規整模塊進行判別比較。輸出的 大緩解。另外武器控制系統的一個方面就是讓 結果作為第三部分的輸入。第三部分為系統的 用戶界面更加人性化,利用語音識別技術也是實 控制部分,它主要負責將命令傳遞給執行裝置和 現人性化的一個重要途徑。本設計就是針對這 識別結果的顯示?!》N情況展開研究?!。病∠到y框架 武器聲控控制系統由三部分組成,其系統框 圖如圖l所示。第一部分為模/數轉換部分,主 要負責模擬與數字語音信號之間的轉換以及顯 示輸出。由于人類語音信號的主要頻率都在 圖1系統框圖?。矗耄龋韵?,并考慮到聲音采樣應該稍微大于I臨 界頻率,故選擇lOkHz作為采樣頻率。第二部 3 相關算法 分為語音識別部分,是整個系統的核心,其作用?。常倍它c檢測的方法 是將輸入的數字語音詞條信號進行分析,識別出 語音和噪音信號的頻譜特征差異是很大的。?。崭澹牛炱冢海玻埃埃丁埃丁玻?; 修回El期:2006一lO—O8 作者簡介:馬龍華(1976--).博士研究生,研究方向:導航制導與控制。
維普資訊
? 262 ? 彈箭與制導學報 ,0?。玻埃埃肪堋。迹荆硪唬保荨≡肼暤念l譜中各頻帶之間變化比較平緩,語音的 頻譜卻比較激烈,根據這一特點可以很明顯的區?。禧悺《玻ǎ搿。妫郏怼。保荩啤。辏恚保荨堋 埽荆恚荨》终Z音和噪聲。由此,計算某一幀信號的各個頻 帶能量的方差,將這種以短時頻帶能量方差作為 參數檢測語音段的起始點的方法叫做頻帶方差 檢測法。定義一個矢量如式(1): X一(?。ā。铮。ā。玻?,…,?。ā。。ǎ保∑渲械姆至俊。ā。┒x為中心頻率為 的濾波 器的輸出能量??梢詫⒁粠盘柕模疲疲宰儞Q后 把幾個頻率分量組合得到頻帶能量矢量。由此可 以定義均值和方差如式(2)、(3):?。薄。薄骸。乓弧隆保撸簦撸薄。荆骸。ā。。ǎ玻。ⅰ。薄。囊弧臁敝小。摺疲邸。ā。┮幻鳌。ǎ常z測門限一般?。鸵唬ǎ场矗摹。摹楸尘霸肼暋〉念l帶方差。當某一段及其以后數段的短時方差 都大于門限值M時判為起始點,當某一段以后 數段的短時方差都小于門限時判定為結束點。圖 2為漢語“發射一發射”語音信號,圖3為其對應 的頻帶方差,從仿真得到的圖中可以看出語音的 起始點可以用這種方法較好地檢測出來?!。 瘛。伞。椤。伞。裕颉。摺 。撸 瘛 瘛。。保啊D2 “發射一發射”圖3 “發射一發射”語 語音波形圖 音的頻帶方差圖?。常病∶罓柕棺V系數 美爾倒譜系數考慮了人耳的聽覺特性,將頻 譜轉化為基于美爾頻標的非線性頻譜,然后在轉 換到倒譜域上。由于充分考慮了人的聽覺特性,美 爾倒譜系數具有良好的識別特性和抗干擾能力?!≌Z音信號首先經過FFT變換,轉換到頻率域: l?。。凼牵荩摺啤 保荩澹。埃迹恕埽巍。ǎ矗。钜唬啊《x包含M個三角濾波器的三角濾波器組?。取。郏耍荩ā∫唬?,2,…,M),第 個濾波器可以由 式(5)給出: H?。邸。菀弧。丙悺《玻ǎ妫邸。恚悾保荩悾耄剑贰。荆恚荨堋 堋。怼。臁。啊。荆荆恚保荨∫部梢杂墒剑ǎ叮┙o出:?。龋骸。邸。菀弧?, O?。嫁蹋硪唬保荨。辏薄。撸保荨堋。荨、椤。荨堋 堋。恚。荨。。铩。巨獭。保荨∵@里H: [?。轁M足約束條件∑H?。邸。菀唬?,這兩 組濾波器的區別在于輸入同乘的系數不同,因此 對于相同的三角組濾波器處理的模板和輸人數 據來用于語音識別不會帶來什么不同。 這里SEmi定義如下,定義-廠J表示濾波器的 最低頻率; 表示濾波器的最高頻率,兩者的刻 度都為Hz。F 為采樣頻率,刻度也是Hz。M為組 濾波器的個數,N為FFT的點數,則尢研]的邊 界點為美爾刻度單位劃分。計算公式可由式(7) 得到:?。樱牛恚橐弧。撸保郏拢?,1)+m?。荨。ǎ罚∵@里美爾刻度的轉換公式:?。拢◤S)一¨251n( +志?。ǎ福∑淠婧瘮禐椋骸。乱弧。ǎ叮┮唬罚埃埃ǎ濉∫唬保。ǎ梗D4?。停澹鞛V波器劃分圖 則第研個濾波器的對數能量輸出可以由式?。ǎ保埃﹣肀硎荆骸。巍。伞。螅ㄑ校┮唬欤睿邸疲伞。。ā。伞#取。ā。荨。ǎ保铮。剑啊⊙幸唬保玻汀?/p>
維普資訊
第27卷第2期 武器聲控系統的設計與實現 馬龍華等 ?263? 將上述對數頻譜經過離散余弦變換到倒譜域就 可以得到美爾倒譜系數C?。ā。骸。瓦B續條件: 叫( +1)一叫(?。┮弧。谩。ā。┮弧疲螅ǎ薄。螅ā。?。os[-a—— 廣一]n(?。恚保玻荨。ā。┮弧疲弧唬铮?,2叫( ≠叫( 一?。薄。?,2 叫( )一w(n一1)?。ǎ保矗。?,2,…,M (11) 依照動態規劃的一般算法,它是從過程的最后一 個階段開始考慮,也就是最優決策的逆過程。首 先求解D( ,?。?,它應該是d(N,M)加上以下三 個距離D(N一1,M),D(N一1,M一1),D(N一?。?,M一2)中的最小值??紤]到式(10)提到的連續 約束條件,D(N一1, 不允許來自D(N一2,M)?!∪缓笈袛啵模ǎ我唬?, ,D(N一1,M一1),D(N一 1,M一2),這時需要計算d(N一1, ),m應該是 —N一1列上允許的值。依次類推,逐次向起始點 推進。整個決策過程可以寫成遞推公式: 圖5“發射”語音MFCC圖 D( +1,m)一d[?。保。荩。常场討B時間規整算法?。颍模ǎ罚恚纾ǎ睿。≡谡Z音識別中不能簡單的將輸人和模板直?。恚榻幼霰容^,這樣的效果很差。這是因為語音信號?。睿摹#ā。?,m 一-12;?。担∈蔷哂邢喈敶蟮碾S機性的,即使是同一個人在不 式中: 同時刻的對同一句話的同一個發音也不可能具 有完全的時間長度,因此對輸人信號進行時間規?。纭∫唬??!蕖。ā#祝ā。罚。蹋祝ā∫唬薄 臁。。丁≌潜夭豢缮俚?。動態時間規整(dynamic?。簦椋恚濉∵@里,g( ,m)的引人,等效于 , 的取值滿足上?。鳎幔颍穑模裕祝┦前褧r間規整和距離測度計算結 面提到的約束條件。 合起來的一種非線性規整技術。假設語音參考模 板的特征矢量序列為a。,a ,…,aM;輸人語音信 號的特征矢量序列為b ,b ,…,b ,M≠N,則動?。聪到y實現 態時間規整就是要尋找時間規整函數 一 由于武器系統的可靠性是最主要的,成本應 叫(?。演斎四0宓臅r間軸,z非線性映射到參 該服從于可靠性,在這個指導思想的指導下選擇 考模板的時間軸 ,并且滿足方程式(12): 的平臺組成為SPT4~8C一3 PC/IO4CPU主板、?。模椋幔恚铮睿洹。茫颍螅簦幔臁。停汀。校茫保埃绰暱?、有源全向麥?。摹恚椋睢疲洌邸〗校ǎ罚荨。ǎ保玻】孙L、Vxworks5.5嵌人式操作系統。SPT4— 其中: 叫(?。菔堑凇斎耸噶亢偷冢瑓ⅰ。福靡唬场。校茫桑希矗茫校罩靼逯С郑校睿泄δ埽黝l為 考矢量的距離,D是相應于最優時間規整下兩模?。校桑桑桑福埃啊。停龋?,能直接支持該聲卡的PnP功能。有 板的距離測度。動態時間規整是一個典型的最優 源麥克為聲音采集裝置,有源麥克采集聲音后的 化問題,它用滿足一定條件的時間規整函數 輸出為錄音的輸人,即有源麥克的輸出信號接在 (”)描述輸人模板和參考模板的時間對應關?。牛樱保福叮梗频模蹋桑危牛桑巫笥彝ǖ垒斎松?。由于Vx— 系,將求解兩模板匹配時累計距離最小對應的規?。鳎铮颍耄笙聸]有提供Diamond Crystal?。停汀。校茫保希础≌瘮?。輸人模板與儲存模板之間的距離可以作 聲卡的驅動,因此需要開發聲卡的驅動程序?!檎Z音識別的一個判據。動態規劃是一種最優化?。矗甭暱寗幼⒁獾膯栴} 算法,它將一個N個階段的決策過程,也就是說 聲卡初始化后就可以自己連續工作,它通過 逐一做出的N個子決策問題,以便使計算問題簡 DMA將數據直接送到指定內存環,并產生中斷 化。在動態規劃的具體問題中規整函數叫(,z)應 來提醒應用程序及時處理。聲卡的初始化過程 滿足邊界條件和連續條件的約束。邊界條件: 中可以按照聲卡說明的步驟即可。但是由于 叫(1)一1,叫(N)一M?。ǎ保常。模停恋牡刂肺粩迪拗疲模停敛荒苓M行32位尋
維普資訊
??。玻叮础? 彈箭與制導學報 址,不能用動態分配內存的方式來給DMA分配 緩沖區,DMA只能進行低24位尋址,而系統的 低端存是可以用來進行DMA傳送的。因此要 選擇系統內不和別的DMA沖突的低端內存空 間,但是Vxworks并不能自動識別要分配的空 間,因此要修改Vxworks的pc.h還有sysLib.c 匹配成功后長時間沒有第二個命令時返回第一 個命令匹配,這里初始化這類的命令除外?!。怠〗Y果分析 由圖2和圖3可以得到,這種方法可以準確 地判斷出語音的起始點。并由圖5可知利用每 來傳人設定的地址和空間大小,同時系統DMA 個時間片的MFCC系數都是相等的可以計算出 和卡上的DMA模式一定要相同,否則就會出現 無法進入中斷等故障。向DMA控制寄存器里 面寫入的值要和設定的值相同。當產生一個中 斷時就說明有一半的傳輸已經完成,可以安全的 拷貝走其中的數據,每次中斷來時就可以用類似 乒乓操作的方式來讀走數據?!。矗沧R別模塊實現的具體問題 模板個數的選取,對于實際應用來說使用者 主要為男性,女性較少。因此每個命令選3個男 性和1個女性作為實際的模板。男性女性選擇3 個模板。這樣有助于提高識別能力,由于武器操 作中命令不會很多,因此詞匯表選擇為50個兩 個字的命令?!≡鲆嫦禂档恼{整,讓每個操作員在正確的戰 位位置上發音,記錄這時候聲音的平均幅度為標 準值l,然后對端點檢測后的語音進行增益調 整,以便盡量抵消操作員的發音指向帶來的語音 波形的變化?!。停疲茫孟禂惦A數的選擇,由于MFCC屬于 倒譜運算的一種,因此它的系數也有遞減的特 性,MFCC的系數最好不要低于8,低于8會對 識別有影響。高于13以后的識別效果沒有明顯 的改善并且階數越高計算量也就越大,因此可以 將MFCC參數13階以上的全部忽略,從而減少 匹配的運算量,在計算的過程中選擇4O階的?。停疲茫脜担侵挥星埃保硞€參數參加匹配運 算,試驗結果也表明大于13以后識別正確率沒 有明顯的提高?!∑ヅ洳呗缘倪x擇,一般按照武器使用順序為 匹配順序,也就是說第一個匹配一般對應于第一 個命令,其后的匹配與對應于的武器使用順序的 命令為第一匹配。當第一或者某個匹配大于某 個特定的閩值時直接結束搜索,當全部搜索都小 于某個特定閾值時就轉回最初匹配。當在以上 兩個閾值之間時輸出最佳的匹配結果。當一個 一個時間片的距離。然后根據這個距離就可以 利用DTW方法來進行時間規整,求出輸入語音 和所有模板之間的距離,做出判別結果。表1給 出了最終試驗結果?!”恚辈煌0鍞底R別結果比較 由以上結果分析可知,由模板數1增加到2 的時候識別率有明顯的提高,但是由2增加到3 的時候識別率提升不是很大。因此模板數太多 以后對識別率不會有太大的改善。從試驗結果 來看本系統能夠減輕操作員55 的操作動作, 能夠極大地減輕操作強度。由此可知該系統能 夠滿足武器系統語音控制的實際要求。?。蹍ⅰ】肌∥摹~I]?。郏保荩獭。摇。遥幔猓椋睿澹?。B H Juang.Fundamentals?。铮妗。螅穑澹澹悖琛。颍澹悖铮纾睿椋簦椋铮睿郏停荩危澹鳌。剩澹颍螅。校颍澹睿簦椋悖濉。龋幔欤臁#保梗梗常。郏玻荩兀酰澹洌铮睿纭。龋酰幔睿纭#粒欤澹粒悖澹颍洌龋螅椋幔铮祝酰澹睢。龋铮睿。樱穑铮耄澹睢。蹋幔睿纾酰幔纾澹郏停荩危澹鳌。剩澹颍螅澹。校颍澹睿簦椋悖濉。龋幔欤??!。玻埃埃保。郏常荩龋幔睿蟆牵酰睿簦澹颉。龋椋颍螅悖琛。幔睿洹。模幔觯椋洹。校澹幔颍悖澹裕瑁濉。幔酰颍铮颍帷。澹穑澹颍椋恚澹睿簦幔臁。妫颍幔恚澹鳎铮颍搿。妫铮颉。簦瑁濉。穑澹颍妫铮颍恚幔睿悖濉。澹觯幔欤酢。幔簦椋铮睢。铮妗。螅穑澹澹悖琛。颍澹悖铮纾睿椋簦椋铮睢。螅螅簦澹恚蟆。酰睿洌澹颉。睿铮椋螅。悖铮睿洌椋簦椋铮睿螅郏粒荩桑樱茫痢。桑裕遥住。粒樱遥玻埃埃埃郏悖荩樱澹稹。簦澹恚猓澹颉。玻埃埃埃。郏矗萃醣a,屈丹。彭煊.實用語音識別基礎[M].北 京:國防工業出版社.2005.?。郏担荨。牛洌鳎幔颍洹。校谩。耍幔铮粒睢。椋睿簦颍铮洌酰悖簦椋铮睢。簦铩。螅簦铮悖瑁幔螅簦椋恪。穑颍铮悖澹螅螅澹蟆。猓澹颍椋睿纭。悖瑁椋睿帷。恚幔悖瑁椋睿濉。穑颍澹螅螅郏冢荩玻埃埃常。郏叮菀卓顺酰锉?。付強.語音信號處理[M].北京:國 防工業出版社。2000.
本文發布于:2024-03-02 09:33:14,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/1709343195275885.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:武器聲控系統的設計與實現.doc
本文 PDF 下載地址:武器聲控系統的設計與實現.pdf
| 留言與評論(共有 0 條評論) |