a级片网址,www.一级毛片,日批国产,中文字幕日韩精品有码视频,黄色毛片免费网站,久久久精品午夜免费不卡,天堂福利视频

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

語(yǔ)音開(kāi)發(fā)平臺(tái)的現(xiàn)狀

2020-03-18 18:07:08   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com) (編譯/老秦): 語(yǔ)音供應(yīng)商正在探索新的途徑來(lái)擴(kuò)展其開(kāi)發(fā)工具的使用。增強(qiáng)的建模精度,改進(jìn)的后端集成,對(duì)其他接口的擴(kuò)展以及更開(kāi)放的系統(tǒng)是2019年的重點(diǎn)領(lǐng)域。2020年的重點(diǎn)是標(biāo)準(zhǔn)接口的開(kāi)發(fā)和可移植性的提高。
 
  年度回顧
  在構(gòu)建解決方案時(shí),語(yǔ)音供應(yīng)商致力于為用戶提供公司應(yīng)用程序的直觀界面。亞馬遜于6月份宣布的Alexa演示語(yǔ)言就是一種用于用戶界面設(shè)計(jì)的工具集。它具有技能個(gè)性化功能,使開(kāi)發(fā)人員可以使用Alexa應(yīng)用程序捕獲的語(yǔ)音配置文件來(lái)創(chuàng)建個(gè)性化技能。語(yǔ)音配置文件可解決首選項(xiàng),記住設(shè)置并區(qū)分用戶。
  改善語(yǔ)音識(shí)別是人們持續(xù)關(guān)注的領(lǐng)域。十月份,亞馬遜在其Alexa技能套件中添加了三套新工具。此開(kāi)發(fā)工具包可幫助公司建立自助服務(wù)應(yīng)用程序。其中兩個(gè)功能是"自然語(yǔ)言理解(NLU)評(píng)估工具"和"話語(yǔ)沖突檢測(cè)",旨在提高語(yǔ)音模型的準(zhǔn)確性。前者測(cè)試成批的話語(yǔ),并將語(yǔ)音應(yīng)用程序的自然語(yǔ)言處理(NLP)模型對(duì)它們的解釋與期望進(jìn)行比較。為了提高結(jié)果質(zhì)量,NLU評(píng)估工具依賴于消費(fèi)者通常說(shuō)的命令,而不是由交互模型構(gòu)建的樣本話語(yǔ)。結(jié)果,系統(tǒng)通過(guò)識(shí)別有問(wèn)題的話語(yǔ)來(lái)隔離訓(xùn)練區(qū)域。該工具還支持回歸測(cè)試,允許開(kāi)發(fā)人員在向語(yǔ)音應(yīng)用添加新功能后創(chuàng)建并運(yùn)行評(píng)估。
  NLU評(píng)估工具使用生產(chǎn)中的數(shù)據(jù)以匿名的高頻現(xiàn)場(chǎng)話語(yǔ)進(jìn)行測(cè)量,該數(shù)據(jù)旨在幫助調(diào)整對(duì)語(yǔ)音模型所做的任何更改的準(zhǔn)確性。
  話語(yǔ)沖突檢測(cè)功能可以檢測(cè)偶然映射到多個(gè)意圖的話語(yǔ),這是可能會(huì)降低NLP模型準(zhǔn)確性的一個(gè)因素。該功能會(huì)在構(gòu)建每個(gè)模型時(shí)自動(dòng)運(yùn)行,并且可以在發(fā)布應(yīng)用程序的第一個(gè)版本之前使用,也可以隨著時(shí)間的推移添加意圖而使用。
  除了前端開(kāi)發(fā)之外,在過(guò)去幾個(gè)月中,還強(qiáng)調(diào)了與后臺(tái)業(yè)務(wù)應(yīng)用程序的集成。9月,Nuance Communications擴(kuò)展了Nuance智能互動(dòng)平臺(tái)的功能,該平臺(tái)在市場(chǎng)營(yíng)銷業(yè)務(wù)流程中增加了語(yǔ)音功能。開(kāi)發(fā)環(huán)境現(xiàn)在具有連接到:
  • 消息服務(wù),以便公司可以跨多個(gè)渠道自動(dòng)化和改善人工協(xié)助的客戶參與度;
  • 座席AI服務(wù),旨在為座席和主管提供相關(guān)的實(shí)時(shí)客戶信息;
  • 安全和生物識(shí)別服務(wù),以改進(jìn)身份驗(yàn)證并防止欺詐;
  • 后端集成,因此該平臺(tái)可與提供所需信息的第三方認(rèn)知引擎和數(shù)據(jù)源一起使用。
  數(shù)據(jù)分析已成為第三方開(kāi)發(fā)人員關(guān)注的另一個(gè)領(lǐng)域。亞馬遜增加了一個(gè)Get Metrics API,該API與第三方數(shù)據(jù)聚合平臺(tái)一起使用,允許開(kāi)發(fā)人員評(píng)估各種指標(biāo),例如唯一客戶。它還支持創(chuàng)建監(jiān)視器,警報(bào)和儀表板,以突出可能影響客戶參與度的更改。
  語(yǔ)音開(kāi)發(fā)平臺(tái)傳統(tǒng)上具有不同程度的開(kāi)放性。例如,蘋(píng)果公司一直致力于將其系統(tǒng)與自己的解決方案聯(lián)系在一起,這給開(kāi)發(fā)人員使用替代產(chǎn)品帶來(lái)了挑戰(zhàn)。十月份,供應(yīng)商通過(guò)允許Siri使用第三方應(yīng)用程序來(lái)打開(kāi)其系統(tǒng)。用戶可以調(diào)用第三方應(yīng)用程序(如WhatsApp)來(lái)代替Apple解決方案(如其自己的Messages應(yīng)用程序)。但是,第三方將需要將該功能添加到其軟件中。
  展望未來(lái)
  對(duì)于語(yǔ)音開(kāi)發(fā)人員而言,可移植性一直是一項(xiàng)長(zhǎng)期挑戰(zhàn)。"語(yǔ)音應(yīng)用程序開(kāi)發(fā)人員發(fā)現(xiàn),每當(dāng)他們將軟件從一個(gè)語(yǔ)音引擎轉(zhuǎn)移到另一個(gè)語(yǔ)音引擎時(shí),他們都必須重寫(xiě)軟件的大部分內(nèi)容,"Conversational Technologies負(fù)責(zé)人,萬(wàn)維網(wǎng)聯(lián)盟多模式交互工作組主席Deborah Dahl指出。
  可移植性涉及許多問(wèn)題。舊版系統(tǒng)旨在在數(shù)據(jù)中心的服務(wù)器上運(yùn)行。許多新系統(tǒng)具有云優(yōu)先設(shè)計(jì)。將軟件從一種遷移到另一種是一項(xiàng)復(fù)雜的工作。Nuance的智能參與平臺(tái)具有與云無(wú)關(guān)的靈活性,允許組織在Nuance的托管,公共和私有云中部署相同的解決方案。
  設(shè)備支持是另一個(gè)重點(diǎn)領(lǐng)域。Nuance全渠道解決方案高級(jí)副總裁Tony Lorentzen表示:"我們將繼續(xù)看到語(yǔ)音成為新界面,越來(lái)越多的設(shè)備將啟用語(yǔ)音功能。"
  然后,這些解決方案必須與傳統(tǒng)解決方案集成。亞馬遜的Alexa演示語(yǔ)言使開(kāi)發(fā)人員可以為帶有屏幕的設(shè)備(例如臺(tái)式機(jī)和筆記本電腦)創(chuàng)建Alexa技能。
  另一個(gè)可移植性問(wèn)題是將軟件從一個(gè)系統(tǒng)遷移到另一個(gè)系統(tǒng)。從歷史上看,市場(chǎng)缺乏標(biāo)準(zhǔn)接口,因此企業(yè)和第三方每次使用不同的語(yǔ)音引擎時(shí)都必須完成共同的工作,例如分配存儲(chǔ)。
  十月份,Nvidia推出了Jarvis,這是一種多模式AI軟件開(kāi)發(fā)套件,該套件將語(yǔ)音,視覺(jué)和其他傳感器整合到一個(gè)系統(tǒng)中。該工具支持用于構(gòu)建,訓(xùn)練和部署GPU加速的人工智能系統(tǒng)的工作流,該系統(tǒng)可以結(jié)合手勢(shì)和眼睛運(yùn)動(dòng)等視覺(jué)提示以及語(yǔ)音來(lái)建立上下文。
  9月,亞馬遜牽頭成立了語(yǔ)音互操作性計(jì)劃小組,這是一個(gè)創(chuàng)建標(biāo)準(zhǔn)語(yǔ)音開(kāi)發(fā)接口的計(jì)劃。該小組設(shè)定了以下四個(gè)目標(biāo):
  • 開(kāi)發(fā)與其他解決方案一起使用的語(yǔ)音服務(wù),同時(shí)保護(hù)客戶的隱私和安全;
  • 構(gòu)建語(yǔ)音功能的設(shè)備,通過(guò)多個(gè)同時(shí)的喚醒詞來(lái)促進(jìn)選擇和靈活性;
  • 發(fā)布使更容易在單個(gè)產(chǎn)品上集成多個(gè)語(yǔ)音服務(wù)的技術(shù)和解決方案;
  • 加速機(jī)器學(xué)習(xí)和對(duì)話式AI研究,以改善語(yǔ)音服務(wù)的廣度,質(zhì)量和互操作性。
  包括百度,微軟,Salesforce.com和Verizon在內(nèi)的30多家公司支持這項(xiàng)工作。蘋(píng)果和谷歌是缺席者。該小組的第一批成果有望在2020年到來(lái)。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Paul Korzeniowski
  原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Developer-Platforms-139108.aspx
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)

永善县| 依兰县| 乐陵市| 梨树县| 英吉沙县| 通州市| 龙游县| 荆州市| 翁源县| 蓝山县| 上林县| 南华县| 璧山县| 嘉祥县| 获嘉县| 久治县| 涡阳县| 成都市| 冷水江市| 古蔺县| 泰兴市| 铁岭县| 天镇县| 漾濞| 渭源县| 山东省| 横山县| 乌兰察布市| 凉城县| 泰安市| 旺苍县| 大宁县| 桂阳县| 莫力| 大化| 芦溪县| 镇沅| 拜城县| 黎平县| 灌云县| 卓资县|