色另类_婷婷激情四月_亚洲精品无码不卡在线播放he_欧美第七页_精品国产综合区久久久久99_青娱乐极品盛宴在线

產(chǎn)品分類

當(dāng)前位置: 首頁 > 傳感測量產(chǎn)品 > 數(shù)據(jù)采集產(chǎn)品 > 數(shù)據(jù)采集卡

類型分類:
科普知識
數(shù)據(jù)分類:
數(shù)據(jù)采集卡

DSP嵌入式說話人識別系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布日期:2022-04-17 點擊率:65

    0 引 言
     說話人身份識別屬于生物認(rèn)證技術(shù)的一種,是一項根據(jù)語音中反映說話人生理和行為特征的語音參數(shù)來自動識別說話人身份的技術(shù)。近年來,說話人身份識別以其獨特的方便性、經(jīng)濟性和準(zhǔn)確性等優(yōu)勢受到矚目,在信息安全等領(lǐng)域的應(yīng)用逐漸增大,并成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩炞C方式。目前,說話人身份識別在理論上和實驗室條件下已經(jīng)達到了比較高的識別精度,并開始走向?qū)嶋H應(yīng)用階段。AT&T、歐洲電信聯(lián)盟、ITT、Keyware、T-NETIX,Motorola和Vi-sa等公司相繼開展了相關(guān)實用化研究,國內(nèi)這方面研究主要在中科聲學(xué)所,中科院自動化所,清華大學(xué)等研究所和大學(xué)中進行。
     基于嵌入式的說話人身份識別系統(tǒng)具有高精度,適時性好,低功耗,低費用,體積小等優(yōu)勢,逐漸成為說話人身份識別面向?qū)嶋H應(yīng)用的新熱點。而隨著DSP新技術(shù)的發(fā)展,DSP芯片無論在處理速度、精度、功耗或者體積等方面都取得了突破性的進展。DSP也越來越多的應(yīng)用于說話人身份識別。但目前這方面研究主要局限于小數(shù)據(jù)量、與PC機配套使用上,沒有太大的實用價值。在此介紹一種基于TMS320C6713 DSP芯片設(shè)計的嵌入式,10個人范圍的說話人身份識別系統(tǒng)。該系統(tǒng)可以自舉運行,并可靈活的選擇訓(xùn)練、識別或者更換訓(xùn)練者、識別者,識別率達98%以上。


1 系統(tǒng)的架構(gòu)及硬件構(gòu)成
     系統(tǒng)總體實現(xiàn)流程如圖1所示。系統(tǒng)主要分為訓(xùn)練和識別兩部分,系統(tǒng)初始化后由操作者控制訓(xùn)練或識別。訓(xùn)練目的是提取說話人模型參數(shù)并將其存儲在FLASH ROM中。識別目的是讀取待識別者語音信息并將獲得的模型參數(shù)與訓(xùn)練的模型參數(shù)比較,從而獲得識別結(jié)果。



1.1 系統(tǒng)的主要硬件構(gòu)成
     系統(tǒng)硬件構(gòu)成如圖2所示,主要包含語音采集模塊、數(shù)據(jù)處理模塊(DSP)、程序數(shù)據(jù)存儲及自舉FLASH模塊、數(shù)據(jù)存儲器RAM模塊、系統(tǒng)時序邏輯控制CPLD模塊、JTAG接口模塊。



     語音采集模塊主要由TLV320AIC23音頻編解碼器來完成,該芯片是TI公司的一款高性能的立體聲音頻Codec芯片,內(nèi)置放大器,輸入/輸出增益可編程設(shè)置。模數(shù),數(shù)/模轉(zhuǎn)換集成在一塊芯片中。采樣率8~96 kHz可編程實現(xiàn)。另外還具有低功耗,連接電路簡單,性價比高的特點。


    語音處理DSP采用TI公司的TMS320C6713芯片,該芯片實現(xiàn)浮點運算,最高時鐘頻率225 MHz,使用該芯片外部存儲器接口可實現(xiàn)對外部存儲器(SDRAM)數(shù)據(jù)傳輸和程序存儲器(FLASH ROM)進行程序讀寫;依靠JTAG接口電路通過仿真器進行仿真調(diào)試,實現(xiàn)與主機數(shù)據(jù)交換;通過片內(nèi)外設(shè)McBSP完成串行數(shù)據(jù)的接收和發(fā)送,實現(xiàn)對音頻處理模塊的控制等工作。
     FLASH ROM最大可提供512 KB空間,通常為前256 KB可用。SDRAM最大容量為16 MB,為該系統(tǒng)提供較大的數(shù)據(jù)存儲空間。CPLD為存儲器的擴展實現(xiàn)邏輯編碼。電源為TPS54310芯片,可為系統(tǒng)提供3.3 V和1.26 V兩種電壓。
1.2 選擇說話人
     該系統(tǒng)要訓(xùn)練10個人的語音,每個人的語音存放在FLASH ROM的不同位置。在訓(xùn)練的開始階段,系統(tǒng)需確定當(dāng)前訓(xùn)練者的身份,以便對訓(xùn)練完成后說話者模型參數(shù)存儲位置有準(zhǔn)確的判斷。對當(dāng)前訓(xùn)練者身份的選擇由系統(tǒng)中的4個Switch實現(xiàn)。若把每個Switch的開關(guān)兩種狀態(tài)看成是二進制數(shù)的0,1,則最終可形成16種組合,代表16個人。該系統(tǒng)選取前10個組合。
1.3 AIC23語音采集
     考慮到系統(tǒng)的實用性,語音的輸入由mic in接口輸入。語音采集若設(shè)為雙聲道,則采集的左右聲道數(shù)據(jù)差別不大,對識別沒有太大的幫助,而且采集到的語音會占用太大存儲器空間,故采用單聲道采樣;對于采樣精度要求,TLV320AIC23可實現(xiàn)8~96 kHz,16 b,20 b,24 b,32 b,的不同采樣,隨著采樣頻率的提高,采樣間隔將相應(yīng)的縮短,要求更大的內(nèi)存空間和更長的處理時間,實驗表明,采樣率由16 kHz下降到8 kHz,所造成的識別率的微乎其微,但是可以節(jié)省50%的動態(tài)存儲空間,并可減少大量的運算。對于采樣位數(shù),16 b精度已能滿足該系統(tǒng)要求,故采樣精度設(shè)為8 kHz,16 b采樣。

下一篇: PLC、DCS、FCS三大控

上一篇: 索爾維全系列Solef?PV

推薦產(chǎn)品

更多
主站蜘蛛池模板: xx520av| 噜噜狠狠 | 一级aaaaaa片毛片在线播放 | 日本久久黄色 | 欧美激情免费观看一区 | 精品欧美乱码久久久久久1区2区 | 亚洲看片网 | 97se亚洲综合在线韩国专区福利 | 中文字幕在线视频日本 | 国产图片区 | 亚洲一区二区在线播放 | 中文字幕免费在线观看视频 | 日本精品一二三区 | 99九九精品视频 | 亚洲国产精品无码观看久久 | 新视觉yy6080午夜毛片 | 国产精品久久久久影院色老大 | 成人 在线 | 夜干夜夜| 成人黄色在线观看 | 欧美日韩福利视频 | 妞干网免费在线观看 | 一级黄色片播放 | 日本在线视 | 精品中文字幕一区 | 国产精品毛片久久久久久久 | 性xxxx免费观看视频 | 欧美日韩一区二区在线视频 | 国产欧美日韩亚洲精品区2345 | 亚洲AV无码色情第一综合网 | 欧美一区2区三区4区公司二百 | 美女污污视频在线观看 | 日韩特级毛片 | 久久久久久国产精品久久 | 久久五月视频 | 免费观看毛片 | 欧美123| 成人精品视频在线观看 | 欧美一区二区在线免费观看 | 一级毛片免费视频 | 成人久久一区二区 |