基于TI的OMAP™平臺為個人手持設備開發(fā)語音應用
出處:computer00 發(fā)布于:2007-06-05 18:28:01
語音技術的應用正在不斷增加,從而為應用開發(fā)商在手持設備、移動設備和無線個人設備中增加高價值的功能帶來了難得的機會。今天的個人手持設備語音大多時候僅僅局限于語音撥號,但是已經(jīng)出現(xiàn)了適用于更廣泛開發(fā)語音識別和文本到語音應用的技術。打算增加語音功能的開發(fā)商需要熟知語音技術的方方面面。這些問題不但包括處理和內存要求,而且還包括特定的平臺架構和支持如何促進開發(fā)過程并縮短上市時間。
&
|
|
語音功能為用戶提供自然的輸入和輸出方式,它比其他形式的 I/O 更安全,尤其是當用戶在開車期間。在大多應用中,語音都是鍵盤和顯示器的理想補充,而并不是它們的替代品。例如,在非常嘈雜的環(huán)境中,聽和說可能都不現(xiàn)實,因此用戶可能就必須依賴鍵盤輸入和顯示閱讀。類似,用戶通常喜歡用鍵盤輸入某些東西,如:PIN 號碼和密碼,而不愿意大聲說出來讓別人也聽到。
語音撥號是當今個人無線設備中常用的語音技術。語音撥號通常無需手和耳朵即可打電話,這是在開車時尤為重要的功能。語音撥號包括名字撥號,即按通訊簿上的名字打電話,另外還包括號碼撥號,即說出電話號碼。如圖 1 所示,其他潛在的語音應用包括: :包括瀏覽郵箱、利用語音輸入寫電子郵件以及收聽電子郵件的讀出。 :股票價格、標題新聞、航班信息、天氣預報等都可通過語音從互聯(lián)網(wǎng)收聽。例如,用戶不用先進入某個網(wǎng)址并輸入股票名字或者瀏覽預定義的列表,便可以命令:"我的股票報價,德州儀器。" :允許用戶通過語音指定預約、查看日歷、添加聯(lián)絡信息等等。 :利用語音程序菜單,用戶可以在網(wǎng)上沖浪、添加語音收藏夾并收聽網(wǎng)頁內容的讀出。 :在自動和眼不夠用的條件下獲取導航的完全語音輸入/輸出駕駛系統(tǒng)。
圖 1:潛在的語音應用
語音系統(tǒng)必須滿足某些基本使用要求。很顯然,語音輸出必須清晰,使用戶能夠聽懂。在給定應用用途中,ASR 還必須支持自然語音。何為自然可謂變化無常,包括從逐字發(fā)出的簡單名字和指令、到說出大量詞匯的連續(xù)語句。另外,各人的自然語音以及發(fā)音方式也不同,因此系統(tǒng)應該能夠靈活接受不同說話人說話。識別引擎必須準確,否則用戶不會使用這種技術。
語音的系統(tǒng)要求是需要進行大量處理,有可能包含巨大的內存,這取決于所支持的詞庫。就基于服務器的應用而言,無線帶寬的使用會有所增加。這些因素也會影響其他系統(tǒng)考慮。應用的MIPS 和傳輸要求越高,給定系統(tǒng)的功耗就越高,因此會縮短電池壽命或導致更頻繁的充電。當應用需要采用處理器外置存儲器時,響應時間也有可能增加。
某些應用權衡考慮有助于通過放棄手持設備不必要的功能來降低系統(tǒng)要求。只識別少量詞語、分散語音的基于說話人的系統(tǒng)會比識別大型詞庫、連續(xù)語音的基于說話人的系統(tǒng)要求少很多的資源。對其他語言的支持會增加處理要求并且使應用所需要的內存加倍??乖胍艉涂垢蓴_性是重要的特性,但是會增加復雜性和內存要求。
很顯然,開發(fā)商在增加說話人依賴性、連續(xù)語音、詞庫規(guī)模和語言支持等功能時希望盡可能少地降低基本應用的性能。有某些選項有助于減少語音技術中的性能降低,如:分布式語音識別(DSR)。DSR把識別任務分割開,這樣手持設備可以把原始語音轉換成頻譜特性向量,同時服務器執(zhí)行識別過程。這種方法以及類似的分布式 TTS 方法依賴于處理方法和傳輸協(xié)議的標準化。盡管這些技術頗有前途,但是,開發(fā)商仍然面臨個人手持設備中語音應用的有限資源。 因此,為語音等高性能應用選擇適當?shù)钠脚_與精心設計應用的功能同樣重要。這種平臺必須具有強大的處理能力,同時可以實現(xiàn)高水平的功效,不僅僅是在操作中,而且在處理內存中也應如此。應該有足夠的 MIPS 來支持多媒體、安全和其他補充應用。提供集成新算法能力的可編程性也很重要。,這種平臺必須包含為支持模塊化應用開發(fā)所設計的軟件架構,以幫助開發(fā)商快速把產(chǎn)品推向市場。
TI 的 OMAP 平臺為在個人手持設備中開發(fā)語音應用提供卓越的解決方案。OMAP1510 和OMAP5910 處理器的雙架構集成了高功效的 TMS320C55x™ 數(shù)字信號處理器 (DSP) 和高性能 ARM9 RI
|
|
OMAP1510 和 OMAP5910 的雙硬件平臺設計用于化系統(tǒng)性能和化功耗。在用于個人手持設備時,DSP 和 RISC 的結合給這些處理器提供了無與倫比的性能和功耗優(yōu)勢。RISC 極其適合處理控制代碼,如:用戶界面、OS 和應用。另一方面,DSP 更適合語音應用所需要的實時信號處理功能。
如圖 2 所示,OMAP1510 架構包含用于兩個處理器的片上高速緩沖存儲器,可降低到外部存儲器的平均發(fā)送次數(shù),同時消除不必要的外部存取的功耗。兩個的內存管理單元 (MMUs)提供虛擬物理內存轉換。低功耗操作模式可保存不使用或者很少使用處理器期間的能力。
圖2:采用 OMAP1510 處理器的簡單配置
OMAP1510 架構還包含兩個外部存儲器接口和單個內存端口。這三個存儲器接口彼此完全獨立,可同時從任何一個或者從 DMA 單元進行存取。每個處理器都具有自己的外設接口,其不但支持到外圍設備的直接連接同時還支持從處理器 DMA 單元的 DMA 連接。定時器、通用 I/O、UART 及監(jiān)視定時器等在內的片上外設以及彩色 LCD 控制器均支持 OS 一般的要求。
OMAP5910 架構不但提供了片上系統(tǒng)功能同時還帶有諸如 192 Kbytes RAM、USB 1.1 主機和客戶機、MMC/SD卡接口、多通道緩沖串口、實時時鐘、GPIO 及 UART、LCD 接口、SPI、uWire 及i2s 等在內的外圍設備。與 OMAP1510 類似,OMAP5910 也包含內置的處理器間通訊機制,其提供與 DSP 連接的透明接口,以實現(xiàn)更輕松的代碼開發(fā)。
在OMAP開發(fā)商網(wǎng)絡中,TI 正與多家正在開發(fā)ASR、TTS、DSR和語者驗證等在內的語音技術的主要第三方開發(fā)商展開合作。這些公司在市場中都有自己獨到的優(yōu)勢,而且他們還可以把這些優(yōu)勢帶給 OMAP 用戶。同時,TI 內部開發(fā)了充分利用了 OMAP 平臺的雙架構優(yōu)勢的、專門用于小詞庫以及小型語音識別等的語音識別軟件。TI 嵌入式語音識別器(TIESR)可提供如下功能: 與說話人無關的指令以及控制功能 與說話人無關的連續(xù)數(shù)字識別 與說話人無關的連續(xù)語音識別 與說話人有關的名稱撥號、指令以及控制 動態(tài)語法和詞匯功能,可提高語音瀏覽等應用 噪音環(huán)境中的抗擾性 用于增強性能的可選說話人適配功能 InfoPhone 是基于這種嵌入式架構的語音應用的一個典型示例,它由 TI 開發(fā),專門用于無線領域。InfoPhone 是一個可實現(xiàn)語音功能的 Java 應用程序,同時它還可實現(xiàn)有用信息的語音檢索。TI 為 InfoPhone 開發(fā)了三種原型的基于語音的信息服務,諸如為用戶提供股票報價、航班信息和天氣預報。每種服務都包含 50 個詞語的詞庫,因為具有動態(tài)詞庫功能,系統(tǒng)可以在詞庫間完美切換。應用設計使鍵盤輸入在說話期間一直保持有效狀態(tài),從而在環(huán)境中斷或者用戶需要進行私密輸入時提供靈活性。圖 3 說明 InfoPhone 示例中的語音識別架構。
圖 3:應用架構示例
TI 的 OMAP 軟件和開發(fā)支持服務可幫助開發(fā)商快速向市場推出語音應用。開發(fā)商可自行采用 TI 的包括 DSP/BIOS 實時操作系統(tǒng)(RTOS)、Code Composer Studio™ IDE、以及可確?,F(xiàn)場軟件的模塊化開發(fā)的 TI 算
另外,TI 還為 OMAP 平臺開發(fā)了 Innovator™ 成套開發(fā)工具。創(chuàng)新開發(fā)工具包提供個人系統(tǒng)的硬件和關鍵軟件,以促進在現(xiàn)實用戶條件下開發(fā)語音應用。
參考文獻:
[1]. RISC datasheet http://www.hbjingang.com/datasheet/RISC+_1189725.html.
[2]. OMAP5910 datasheet http://www.hbjingang.com/datasheet/OMAP5910+_523429.html.
[3]. TMS320C55x datasheet http://www.hbjingang.com/datasheet/TMS320C55x_1578567.html.
下一篇:什么是激勵器
版權與免責聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權均屬于維庫電子市場網(wǎng),轉載請必須注明維庫電子市場網(wǎng),http://www.hbjingang.com,違反者本網(wǎng)將追究相關法律責任。
本網(wǎng)轉載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉載時,必須保留本網(wǎng)注明的作品出處,并自負版權等法律責任。
如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
- 物聯(lián)網(wǎng)邊緣計算網(wǎng)關技術特性與部署運維指南2026/1/6 10:44:20
- 物聯(lián)網(wǎng)云平臺技術架構與選型運維指南2025/12/30 10:05:07
- 工業(yè)級物聯(lián)網(wǎng)網(wǎng)關技術參數(shù)與選型及運維指南2025/12/23 9:51:05
- 什么是IIoT,IIoT的知識介紹2025/6/3 17:22:31
- 物聯(lián)網(wǎng)領域:新興薄膜技術的潛力與挑戰(zhàn)2025/5/12 15:18:17









