a级片网址,www.一级毛片,日批国产,中文字幕日韩精品有码视频,黄色毛片免费网站,久久久精品午夜免费不卡,天堂福利视频

您當(dāng)前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

MRCP協(xié)議學(xué)習(xí)筆記 - 錄音資源的請求、事件和頭詳解

2018-07-30 16:09:26   作者: james.zhu    來源:CTI論壇   評論:0  點擊:


  在前面的兩個大的章節(jié)中,我們介紹了MRCP資源類型的兩個重要媒體類型:語音合成資源和語音識別資源以及它們的請求,事件和頭的詳解今天,我們將繼續(xù)介紹MRCP的另外一個媒體類型 - 錄音資源。MRCP的錄音資源用來捕捉語音數(shù)據(jù),并且以URL的形式保存,以支持同一會話后期訪問。
  MRCP的錄音資源可以具有一些基本的語音處理能力支持語音檢測。這里的語音檢測功能可以支持對錄音起始階段,結(jié)束階段的錄音,甚至于中間的錄音進行靜音壓縮處理,因此移除語音中的靜音部分,從而降低錄音文件存儲大小。另外,如果在預(yù)設(shè)的超時設(shè)置中,沒有收到任何語音,此功能可以支持錄音終止執(zhí)行。如果接收端在結(jié)束之前檢測到一段靜音狀態(tài),錄音資源也要自動結(jié)束錄音。錄音資源的應(yīng)用范圍非常廣泛,可以應(yīng)用在語音留言服務(wù)器環(huán)境,智能客服語音導(dǎo)航等環(huán)境中。在本章節(jié)中,我們會詳細介紹錄音資源的請求,事件和標(biāo)題的具體內(nèi)容。
  1、錄音資源支持三個請求消息和兩個事件信息,以及十五個頭三個請求消息是:
  兩個事件消息是:
  十五個標(biāo)題包括:
  MRCP錄音資源同樣也支持一個狀態(tài)機。MRCP客戶端發(fā)起一個請求,媒體錄音資源生成事件消息。
  2、RECORD請求方法是由MRCP客戶端發(fā)起,默認(rèn)情況下,錄音資源開始捕捉語音數(shù)據(jù)。如果當(dāng)出現(xiàn)在 Capture-On-Speech標(biāo)題出現(xiàn)在請求中,并且此值為true,當(dāng)語音被檢測到以后,錄音資源才開始捕捉語音數(shù)據(jù)。錄音格式是通過Media-Type header來設(shè)置。此標(biāo)題會出現(xiàn)在RECORD請求中。錄音資源對捕捉到語音錄音以后,通過Record-URI的形式表示錄音存儲路徑。如果此標(biāo)題出現(xiàn)沒有支持設(shè)置的值,則錄音資源會在錄音完成事件消息中返回記錄-URI或在STOP請求中,攜帶一個URL地址。
  如果在記錄的請求中省略了記錄-URI,錄音資源則會在錄音完成事件的消息體中或者停止響應(yīng)中返回這個URL值。
  MRCP要求Record-URI至少支持HTTPS來保證數(shù)據(jù)傳輸?shù)陌踩,MRCP同樣也支持經(jīng)常使用的http://和file:// URI的形式。如果Record-URI是無效的地址,則會返回?zé)o效狀態(tài)碼“404標(biāo)題非法值”。如果錄音資源因為各種原因不能對創(chuàng)建的內(nèi)容鏈接,則返回407方法或操作失敗。
  視頻資源,請求中可以支持隊列的處理。的流程圖:
  
  3、默認(rèn)環(huán)境下,啟動錄音以后,No-Input-Timeout標(biāo)頭就會啟動一個無輸入定時器的定時器。如果在定時器超時之前沒有檢測到語音輸入時,RECORD-COMPLETE事件消息會返回完成 - 原因,此值為002 noinput-timeout。通常情況下,系統(tǒng)提示用戶完成輸入以后,MRCP客戶端會馬上發(fā)起一個RECORD請求。對某些應(yīng)用場景來說,用戶輸入的同時需要同時啟動錄音操作。錄音資源可以通過二次設(shè)置來啟動定時器的設(shè)置。RECORD請求中可以設(shè)置開始輸入,定時器為假來表示不啟動定時器,如果需要定時器啟動的話,MRCP客戶端可以發(fā)起一個開始輸入,定時器請求來啟動定時器設(shè)置以下是一個。開始輸入,定時器流程圖:



  4、STOP方法結(jié)束錄音流程,并且通知錄音資源從錄音狀態(tài)切換到空閑狀態(tài)。STOP響應(yīng)消息中包含一個Active-Request-Id-List表示請求停止的ID。以下是一個停止請求的流程圖:
 
  五、MRCP錄音資源支持兩個事件消息,它們分別是START-OF-INPUT和RECORD完成消息。
  當(dāng)錄音資源第一次檢測到語音時,錄音資源會生成START-OF-INPUT事件消息。MRCP客戶端可以使用事件消息來結(jié)束語音回放等流程。例如,在語音合成資源中的強行插入而出現(xiàn)的消息激活打斷流程。
  當(dāng)錄音資源完成對RECORD請求流程后,錄音資源生成并返回RECORD-COMPLETE消息事件,并且錄音資源從錄音資源切換到空閑狀態(tài)。錄音資源會自動結(jié)束錄音流程,結(jié)束的原因會返回到MRCP客戶端。具體結(jié)束原因可能是:無輸入超時,最大時間到期,檢測到最終靜音等。完成 - 原因標(biāo)題表示了RECORD請求結(jié)束的原因。如果錄音結(jié)束后,請求沒有攜帶任何錯誤的話,RECORD-COMPLETE消息則會表示一個錄音文件的URL地址。
  6、錄音資源支持了十五個頭。我們逐一介紹這些報頭的使用方式。
  完成 - 原因,此標(biāo)題總是出現(xiàn)在RECORD-COMPLETE事件中,用來表示RECORD結(jié)束原因。如果出現(xiàn)錯誤的話,它也可能出現(xiàn)在RECORD請求的返回響應(yīng)消息中。示例:完成 - 原因:002無輸入 - 時間到。
  完成 - 原因,此標(biāo)題可選出現(xiàn)在RECORD-COMPLETE事件消息中,提供更多結(jié)束原因代碼。示例:完成 - 原因:磁盤空間不足。為客戶端通過日志跟蹤信息:
  Failed-URI,此標(biāo)題表示訪問所給URL失敗。示例:Failed-URI:http://192.168.1.10/audio/mailbox01.wav。
  Failed-URI-Cause,此標(biāo)題表示訪問URL失敗的具體原因,示例:Failed-URI-Cause:404 Not Found。
  Record-URI,表示錄音的存儲URL路徑。示例:Record-URI:; 大小= 40000;持續(xù)時間= 5000。
  Media-Type,此標(biāo)題表示錄音文件格式。示例:Media-Type:audio / x-wav。
  Capture-On-Speech,此標(biāo)題是一個布爾值,表示是否當(dāng)檢測到語音時開始錄音。默認(rèn)值是假,表示接收方收到錄音請求后馬上開始錄音。示例:Capture-On-Speech:true。
  No-Input-Timeout,此標(biāo)題表示當(dāng)錄音開始時,在設(shè)定的時間內(nèi)沒有檢測到語音。在返回RECORD-COMPLETE事件消息中攜帶完成 - 原因,其值為002 noinput-timeout。示例為:No - 輸入 - 超時:3000。
  最大時,其頭部用來設(shè)定最大錄音時間,此時間從開始錄音計算,不包括其中的靜音壓縮時段。其值以毫秒為單位。當(dāng)錄音時長達到最大錄音時間時,錄音會結(jié)束,錄音資源會生成并且返回RECORD-COMPLETE事件,攜帶完成 - 原因,值為000 success-silence。示例:Max-Time:10000。
  Final-Silence,此標(biāo)題設(shè)定一個靜音時長(毫秒為單位),用來表示錄音結(jié)束前的靜音時長。如果此值為0,表示無窮大,無最后靜音檢測。示例:Final-Silence:3500。
  靈敏度等級,此標(biāo)題表示一個語音檢測的敏感度。取值范圍從0到1.取值比較低表示對噪音不敏感 ;取值比較高表示輸入時靜音比較敏感。示例:敏感度等級:0.85 。
  Trim-Length,此標(biāo)頭使用在STOP請求中。其值表示從錄音結(jié)束起,所移除的時間長度。默認(rèn)值為0.示例:Trim-Length:1000。
  Start-Input-Timers,此header在RECORD請求中設(shè)定一個延遲啟用no-input timer的時間,直到MRCP客戶端重新發(fā)送START-INPUT-TIMERS請求。示例:Start-Input-Timers:false。
  Ver-Buffer-Utterance,此標(biāo)題使用在RECORD請求中,表示錄音文件使用在后續(xù)的說話人驗證流程中,這里,假設(shè)說話讓驗證資源被分配在同一會話中。默認(rèn)值為假。示例:Ver-緩沖 - 話語:是的。
  新的音頻通道,如果此頭在錄音請求中設(shè)置為真,則表示語音數(shù)據(jù)正在從不同的語音資源,通道或講話人發(fā)送。如果此頭出現(xiàn)的話,并且設(shè)置為真,則表示正在調(diào)整某些算法。這些算法可能已經(jīng)在語音檢測中使用,為了適應(yīng)新的語音資源,一些算法需要調(diào)整。示例:New-Audio-Channel:false。
  7、這里,我們稍微花一點時間再多討論一下關(guān)于靜音檢測到問題。首先說明,筆者不是語音檢測算法方面的專家,因為我們在VOIP領(lǐng)域一直涉及相關(guān)的技術(shù)話題,所以這里提醒用戶,對于錄音資源的VAD檢測也是非常重要的一環(huán)。靜音檢測在終端設(shè)計中結(jié)合廠家的技術(shù)特點都有各自的算法,具體的應(yīng)用場景很多,包括檢測語音掛機,降低錄音文件大小,優(yōu)化網(wǎng)絡(luò)帶寬都具有非常重要的作用。關(guān)于在SIP環(huán)境中的VAD檢測,筆者在以前的SIP講座中做過非常深入的討論。這里,我們僅對錄音資源中的靜音處理做一些簡單提示。因為在錄音環(huán)境中,如果沒有對錄音進行靜音檢測處理或者優(yōu)化,它會導(dǎo)致錄音文件非常龐大,嚴(yán)重影響系統(tǒng)存儲性能,同時也會影響語音識別的準(zhǔn)確性。當(dāng)然,如果開啟VAD檢測到話,同時也會增加系統(tǒng)的負載具體。的VAD設(shè)計流程如下:
  更多關(guān)于VAD的算法,讀者可以結(jié)合筆者給出的參考資料做進一步的研究,也可以針對錄音資源的幾個頭做適當(dāng)?shù)恼{(diào)整來優(yōu)化錄音文件。讀者也可以參考PSJIP或FreeSWITCH的的VAD模塊做更多了解。另外,如果讀者想進一步了解VAD的話,讀者也需要結(jié)合靜音壓縮的算法,舒適噪音生成來進一步了解這幾個算法的相互關(guān)系。
  8、在本章節(jié)的分享中,筆者詳細介紹了MRCP中的錄音資源的細節(jié)內(nèi)容,包括請求,事件消息和頭的完整介紹。并且,對錄音優(yōu)化過程中的VAD做了簡單分享,希望讀者在優(yōu)化錄音文件時更多注意這些參數(shù)。
  參考資料:
  TomB?ckstr?m,  語音活動檢測  語音處理
  E. Verteletskaya,K。Sakhnov,語音增強應(yīng)用的語音活動檢測
  Md Sahidullah,說話人識別語音活動檢測技術(shù)的比較
  J.Ramírez,JMGórriz,語音活動檢測;A(chǔ)知識和語音識別系統(tǒng)的穩(wěn)健性




【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

东阳市| 白银市| 新巴尔虎左旗| 都江堰市| 麻栗坡县| 芷江| 安陆市| 沂源县| 阳东县| 行唐县| 陕西省| 青州市| 乐业县| 绵竹市| 湾仔区| 小金县| 栾城县| 建宁县| 千阳县| 黑河市| 苍梧县| 信阳市| 白河县| 泰州市| 嘉峪关市| 肥东县| 四平市| 三门峡市| 天等县| 荃湾区| 仁布县| 正蓝旗| 淮北市| 黔江区| 视频| 固安县| 平安县| 高尔夫| 哈密市| 梨树县| 常德市|