a级片网址,www.一级毛片,日批国产,中文字幕日韩精品有码视频,黄色毛片免费网站,久久久精品午夜免费不卡,天堂福利视频

您當(dāng)前的位置是:  首頁(yè) > 新聞 > 專(zhuān)家觀點(diǎn) >
 首頁(yè) > 新聞 > 專(zhuān)家觀點(diǎn) >

從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路

2016-12-08 09:26:57   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  本文整理自鈦媒體-鈦坦白分享課“AI已來(lái),讓機(jī)器聽(tīng)懂你的聲音”,以下為捷通華聲總經(jīng)理武衛(wèi)東的分享內(nèi)容。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
捷通華聲總經(jīng)理武衛(wèi)東
  大家晚上好,非常有幸在鈦坦白跟大家分享關(guān)于“從語(yǔ)音到全方位人工智能,AI技術(shù)的融合發(fā)展之路”的心得體會(huì)。
  人工智能源于何處,緣何爆發(fā)
  人工智能技術(shù)經(jīng)歷了半個(gè)多世紀(jì)的發(fā)展,現(xiàn)在的人工智能通過(guò)計(jì)算方法能夠賦予機(jī)器一些類(lèi)似人的感知功能,像人有口眼耳手,這是我們的感官功能。我們還有大腦,這是我們的思維認(rèn)知功能,那么機(jī)器人是不是可以具備這些擬人化的功能呢?
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  像人的嘴是用來(lái)說(shuō)話的,耳朵是用來(lái)聽(tīng)聲音的,這就催生了像語(yǔ)音合成、語(yǔ)音識(shí)別這樣的語(yǔ)音技術(shù)。
  圖像識(shí)別就像人觀察外界事物的眼睛,手是用來(lái)拿東西和寫(xiě)字的,這就催生了OCR、手寫(xiě)識(shí)別技術(shù)等這樣的一些圖像識(shí)別技術(shù)。
  在眾多感知功能方面,人工智能技術(shù)還涉及到很多功能,包括人臉識(shí)別,聲紋識(shí)別,指紋識(shí)別等等。經(jīng)過(guò)十幾年的發(fā)展,我們看到人工智能技術(shù)中最難的實(shí)際上是與認(rèn)知相關(guān)的一些技術(shù)。人的認(rèn)知,即人的大腦,是個(gè)非常復(fù)雜的結(jié)構(gòu),可以說(shuō)到今天,我們自己也沒(méi)有研究清楚我們自己的大腦。
  近幾年來(lái),神經(jīng)網(wǎng)絡(luò)尤其是深度學(xué)習(xí),提升了感知計(jì)算的一些模型方法,相關(guān)感知方面的技術(shù)取得了比較大的進(jìn)步。
  實(shí)際上,神經(jīng)網(wǎng)絡(luò)的一些算法研究,早在二三十年前就開(kāi)始了。我記得原來(lái)在學(xué)校的時(shí)候,我們有很多的研究人員就從事在圖像模式識(shí)別方面的一些研究,但是由于當(dāng)時(shí)的算法能力以及設(shè)備能力有限,很難去在復(fù)雜結(jié)構(gòu)和深層次結(jié)構(gòu)上提升算法模型。
  現(xiàn)在的GPU技術(shù)使得過(guò)去復(fù)雜的算法模型能夠通過(guò)有效的訓(xùn)練,提升訓(xùn)練速率,并能夠通過(guò)算法和大數(shù)據(jù)的加工,實(shí)現(xiàn)更加普適性和實(shí)用性的一些模型,供我們做一些智能化的應(yīng)用。
  我們看到現(xiàn)在的語(yǔ)音識(shí)別技術(shù),能夠達(dá)到百分之九十幾,接近于人的甚至在某些方面超過(guò)人的這樣一個(gè)準(zhǔn)確率。通過(guò)深度學(xué)習(xí),語(yǔ)音識(shí)別已經(jīng)實(shí)現(xiàn)了一些突破。
  尤其是隨著互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的發(fā)展,現(xiàn)在交互終端、智能終端,給我們?cè)谘芯糠矫嫣峁┝舜罅康、真?shí)的場(chǎng)景數(shù)據(jù),有了這些大的數(shù)據(jù),使用神經(jīng)網(wǎng)絡(luò)算法,通過(guò)訓(xùn)練,可以讓語(yǔ)音識(shí)別技術(shù)更加實(shí)用化。
  從業(yè)20年談?wù)Z音技術(shù)發(fā)展
  在語(yǔ)音方面,實(shí)際上大家看到,真正最早能夠形成實(shí)用化的語(yǔ)音技術(shù)是從語(yǔ)音合成開(kāi)始的,也就是我們說(shuō)的TTS技術(shù)。
  下面給大家放一些聲音,大家可以聽(tīng)一聽(tīng),現(xiàn)在在語(yǔ)音合成方面,從過(guò)去比較機(jī)械的音色發(fā)展到現(xiàn)在流暢、自然的聲音。
  比如說(shuō)我們?cè)谝恍┐笮偷膱?chǎng)館會(huì)議,像奧運(yùn)會(huì),世博會(huì),包括一些公共場(chǎng)所,像高鐵站,機(jī)場(chǎng)聽(tīng)到的廣播聲,很多實(shí)際上都是通過(guò)語(yǔ)音合成技術(shù)合成出來(lái)的。另外,我們推出了可以唱歌的TTS技術(shù),歌唱TTS實(shí)際上就是在標(biāo)準(zhǔn)的語(yǔ)音合成基礎(chǔ)上,結(jié)合現(xiàn)在一些應(yīng)用場(chǎng)景,比如說(shuō)一些娛樂(lè)機(jī)器人,教育機(jī)器人,玩具等等,在應(yīng)用場(chǎng)景當(dāng)中,我們做的更加娛樂(lè)化的TTS技術(shù)。
  現(xiàn)在大家都在探索和研究一個(gè)新方向,情感TTS。因?yàn)椴还茉趺礃拥囊粋(gè)算法,達(dá)到完全像人一樣的自然、有情感、富有喜怒哀樂(lè)情緒的TTS技術(shù),還是有很多的研究工作要做。當(dāng)前TTS作為一種信息的交流、信息的播報(bào)是完全可以達(dá)到實(shí)用化的程度。經(jīng)過(guò)這十幾年的時(shí)間,捷通華聲在TTS方面,國(guó)內(nèi)市場(chǎng)占有率超過(guò)了50%。
  我再說(shuō)說(shuō)語(yǔ)音識(shí)別,昨天錢(qián)博士,我們清華的一個(gè)師弟特別提到了語(yǔ)音識(shí)別技術(shù)的發(fā)展,F(xiàn)在實(shí)際上就是說(shuō)在語(yǔ)音識(shí)別方面國(guó)內(nèi)也有一些從事語(yǔ)音識(shí)別技術(shù)應(yīng)用和研究的企業(yè),但是從語(yǔ)音識(shí)別現(xiàn)在目前發(fā)展的現(xiàn)狀看,普通話在一個(gè)自然的場(chǎng)景中識(shí)別率達(dá)到96%,97%,其實(shí)已經(jīng)不是什么太高的目標(biāo)。
  但是96%、97%實(shí)際上并不是一個(gè)真實(shí)應(yīng)用場(chǎng)景的指標(biāo),我們要利用這項(xiàng)技術(shù),能夠達(dá)到人人說(shuō)話、大多數(shù)常見(jiàn)聲音環(huán)境中都能達(dá)到這么高的一個(gè)準(zhǔn)確率,還是有很多工作要做的。我個(gè)人認(rèn)為,現(xiàn)在大家說(shuō)96%、97%實(shí)際上是一個(gè)在技術(shù)層面達(dá)到的高度,但是實(shí)際上在實(shí)用化方面,要達(dá)到這樣一個(gè)高度,我感覺(jué)恐怕國(guó)外語(yǔ)音公司也不敢這么說(shuō),我們國(guó)內(nèi)的一些人有時(shí)候在這方面會(huì)更多的注入一些商業(yè)化宣傳。
  大家知道,語(yǔ)音識(shí)別是從2001年、2002年就進(jìn)入了中國(guó)市場(chǎng),但當(dāng)時(shí)的語(yǔ)音識(shí)別,主要是基于命令詞條的識(shí)別。經(jīng)過(guò)十幾年的發(fā)展,語(yǔ)音識(shí)別技術(shù)進(jìn)入到自由說(shuō)的狀態(tài),當(dāng)人自然說(shuō)話、自然表達(dá)時(shí),能夠準(zhǔn)確識(shí)別,這推動(dòng)語(yǔ)音識(shí)別進(jìn)入到實(shí)現(xiàn)應(yīng)用的階段。
  比如說(shuō)在手機(jī)端用輸入法這樣的一些app或者是工具,對(duì)著手機(jī)尤其是現(xiàn)在的手機(jī),都支持多麥克風(fēng),在近講模式下,如果你的普通話說(shuō)得比較好,96%、97%比如說(shuō)像我這樣講話,98%、99%的識(shí)別率也是可能的。但是如果說(shuō)話帶著方言,很重的方言,去識(shí)別,達(dá)到這個(gè)高度,也不是太容易,至少我現(xiàn)在沒(méi)有看到哪家在方言普通話或者普適性人群上面達(dá)到這樣一個(gè)高度。
  當(dāng)然,這里邊還包括不同的輸入設(shè)備,比如說(shuō)在電話端,8K的窄帶數(shù)據(jù)識(shí)別率如果能達(dá)到97%,那真的是效果非常好了,現(xiàn)在大家的水平基本上在80%上下。那么在一些特殊領(lǐng)域里邊,通過(guò)一些垂直領(lǐng)域的優(yōu)化,模型的優(yōu)化,能達(dá)到85%,這已經(jīng)是一個(gè)很好的水平。
  在很多智能家居、家電,包括像機(jī)器人這樣一些智能終端場(chǎng)景下,有很多環(huán)境噪音,語(yǔ)音識(shí)別如果不解決這些數(shù)據(jù)信號(hào)、聲學(xué)信號(hào)的抗噪問(wèn)題,語(yǔ)音識(shí)別的應(yīng)用會(huì)受很大的制約。所以現(xiàn)在從事語(yǔ)音的廠家,在麥克風(fēng)陣列這方面也都開(kāi)始做自己的研究,推出了兩麥,四麥甚至六麥這樣一些抗噪模塊,來(lái)解決實(shí)際應(yīng)用場(chǎng)景下的噪音干擾問(wèn)題。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  大家看到,上面這個(gè)四麥降噪模塊,已經(jīng)在一些機(jī)器人里邊,包括一些服務(wù)機(jī)器人、兒童教育娛樂(lè)機(jī)器人中使用,其中包括線陣和圓陣,重點(diǎn)是解決麥克風(fēng)在遠(yuǎn)講、定向、回聲消除,還有語(yǔ)音增強(qiáng)等實(shí)際應(yīng)用情況。當(dāng)然,語(yǔ)音識(shí)別還包括方言、多語(yǔ)種識(shí)別,以及中英文混合等情況,這些問(wèn)題我們也在不斷的研究、實(shí)踐。
  開(kāi)始時(shí)我們提到,在認(rèn)知功能方面,尤其是像語(yǔ)義理解(NLU),這方面有一些國(guó)內(nèi)企業(yè)在做,捷通在這方面也做了大量的工作,有很多的實(shí)踐和應(yīng)用。
  例如,在智能終端方面,我們做了對(duì)話,包括意圖理解,以滿(mǎn)足智能終端在語(yǔ)義理解和語(yǔ)音識(shí)別共同使用過(guò)程中的一些“理解”用戶(hù)指令的要求。另外,在一些行業(yè)的智能客服的系統(tǒng)里邊,我們也采用了支持多輪對(duì)話、同音字智能糾錯(cuò)、上下文語(yǔ)義分析、相關(guān)問(wèn)題聯(lián)想等功能的語(yǔ)義理解技術(shù),能夠達(dá)到更好的用戶(hù)體驗(yàn)和準(zhǔn)確率。當(dāng)然,語(yǔ)義理解方面要研究的東西還很多。
  語(yǔ)音服務(wù)物聯(lián)網(wǎng) 讓智能設(shè)備“能說(shuō)會(huì)聽(tīng)、能思考會(huì)判斷”
  隨著移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)的發(fā)展,人工智能技術(shù)在物聯(lián)網(wǎng)領(lǐng)域有了越來(lái)越多的需求,或者說(shuō)已經(jīng)成為一種不可或缺的支撐技術(shù)。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  比如在智能機(jī)器人方面,我們通過(guò)智能客服系統(tǒng),來(lái)實(shí)現(xiàn)語(yǔ)音交互、知識(shí)庫(kù)構(gòu)建、語(yǔ)義理解,尤其是前端在噪音環(huán)境下,通過(guò)麥克風(fēng)陣列,實(shí)現(xiàn)遠(yuǎn)講、抗噪、定向等等功能。在智能機(jī)器人領(lǐng)域,我們做了很多行業(yè)應(yīng)用,比如說(shuō)在稅務(wù)大廳提供咨詢(xún)的稅務(wù)機(jī)器人,華夏銀行的大堂經(jīng)理機(jī)器人,還有一些圖書(shū)館,購(gòu)物中心的專(zhuān)業(yè)服務(wù)機(jī)器人,當(dāng)然也包括現(xiàn)在大家看到的很多家用的兒童教育機(jī)器人、娛樂(lè)機(jī)器人,以及陪伴機(jī)器人,通過(guò)應(yīng)用智能客服系統(tǒng),這些機(jī)器人進(jìn)入了各個(gè)行業(yè),未來(lái)將會(huì)進(jìn)入到我們生活的方方面面。
靈云智能機(jī)器人解決方案
  在智能家居、家電方面,比如說(shuō)電視,我們搜電影時(shí),遙控器按鍵輸入慢,總是讓人很頭疼。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  我們將語(yǔ)音技術(shù)應(yīng)用到電視遙控器上,比如小米電視,樂(lè)視,還有廣電盒子,通過(guò)語(yǔ)音的交互,實(shí)現(xiàn)電視內(nèi)容的快速搜索,甚至一些購(gòu)物,社區(qū)服務(wù)等。
靈云智能語(yǔ)音電視解決方案
  在智能家居方面,整合了語(yǔ)音交互的麥克風(fēng)陣列是一個(gè)非常好的工具,我們可以遠(yuǎn)距離隨意控制燈光、調(diào)節(jié)空調(diào)等,通過(guò)引入人工智能技術(shù),讓家居生活更舒適。
  在智能汽車(chē)領(lǐng)域,尤其是現(xiàn)在大家看到的無(wú)人駕駛、輔助駕駛系統(tǒng)中,也是人工智能的一個(gè)很好應(yīng)用。但是我個(gè)人對(duì)于無(wú)人駕駛汽車(chē)未來(lái)的走向,至少目前看,三五年內(nèi)我感覺(jué)很難真正走向?qū)嵱没驗(yàn)榻煌ǹ刂,包括很多交通?guī)則,都會(huì)限制無(wú)人車(chē)在這方面的發(fā)展。但是我相信,通過(guò)引入智能化的一些技術(shù),可以在輔助駕駛,包括像一些車(chē)載領(lǐng)域發(fā)揮很好的作用。
  例如,語(yǔ)音交互技術(shù)在智能車(chē)載上的應(yīng)用,這里邊包括語(yǔ)音識(shí)別的抗噪模型訓(xùn)練、硬件的降噪,以及像喚醒、聲源定向、智能糾錯(cuò)等技術(shù)層面的要求。另外,汽車(chē)現(xiàn)在實(shí)際上已經(jīng)是人們出行的一個(gè)必備手段了,現(xiàn)在北京的交通大家都知道,車(chē)內(nèi)設(shè)備的語(yǔ)音控制實(shí)際上可以有效提高駕車(chē)的安全性。同時(shí),通過(guò)汽車(chē)這樣一個(gè)移動(dòng)設(shè)備,可以給我們提供導(dǎo)航、餐館、訂酒店、訂機(jī)票,以及天氣、股票等信息的語(yǔ)音查詢(xún),甚至成為我們生活當(dāng)中的一個(gè)移動(dòng)辦公場(chǎng)所。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  在這里也提一下,就是我們?cè)谄?chē)交互方式方面的一個(gè)經(jīng)驗(yàn)或感覺(jué),可能東西方人對(duì)于汽車(chē)的操控習(xí)慣不同。比如說(shuō)捷通華聲早在我們成立的時(shí)候,就做了手寫(xiě)識(shí)別技術(shù),在歐美的一些高端車(chē)輛上,通過(guò)引入我們的手寫(xiě),比如像法拉利、奧迪、寶馬,還有日韓系的像尼桑、現(xiàn)代等等這些車(chē)?yán)镞呌玫搅宋覀兊氖謱?xiě)技術(shù)。我們過(guò)去也不太理解,為什么老外覺(jué)得手寫(xiě)還可以用,后來(lái)發(fā)現(xiàn),大家可能在一些操作上邊還是習(xí)慣有些不同,我們中國(guó)人可能更善于講,可能老外更善于做一些實(shí)際的操控性的,所以這個(gè)時(shí)候大家看到我們的語(yǔ)音交互在車(chē)機(jī)里邊是大家關(guān)注的一個(gè)熱點(diǎn),但是手寫(xiě)他們也會(huì)用,而且用的量也不少。不管是用語(yǔ)音的交互還是手寫(xiě)的交互,其實(shí)都是通過(guò)這樣的一些人工智能的交互手段,來(lái)提升人們的駕車(chē)體驗(yàn),提升駕車(chē)的安全性和舒適性。
  捷通華聲推出首個(gè)全方位人工智能開(kāi)放平臺(tái)—靈云
  剛才講了很多物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用場(chǎng)景,下面重點(diǎn)介紹一下捷通目前做的一些靈云全方位人工智能開(kāi)放平臺(tái)方面的工作。
  捷通的靈云平臺(tái)(AIcloud.com)是我們?cè)缭?011年我們就推出的全球首個(gè)全方位人工智能開(kāi)放平臺(tái),在當(dāng)時(shí)我們就定立了這么樣一個(gè)目標(biāo):要實(shí)現(xiàn)語(yǔ)音、手寫(xiě),拍照,手勢(shì)甚至將來(lái)可以使用腦波來(lái)進(jìn)行智能化的一些手段來(lái)進(jìn)行人機(jī)交互。經(jīng)過(guò)幾年的建設(shè),靈云平臺(tái)已經(jīng)構(gòu)建了集合十項(xiàng)核心技術(shù)的全方位人工智能開(kāi)放平臺(tái)。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  其中包括智能語(yǔ)音方面的,語(yǔ)音合成、語(yǔ)音識(shí)別技術(shù);圖像交互方面,OCR、手寫(xiě)識(shí)別;生物特征識(shí)別方面的人臉識(shí)別、聲紋識(shí)別和指紋識(shí)別;智能語(yǔ)義方面,包括語(yǔ)義理解、機(jī)器翻譯、數(shù)據(jù)挖掘等共10項(xiàng)技術(shù)。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  靈云實(shí)際上是通過(guò)構(gòu)建這樣一個(gè)云服務(wù)平臺(tái),提供這些能力,并在能力基礎(chǔ)上,提供智能化解決方案,包括全智能客戶(hù)服務(wù)、多維生物特征識(shí)別身份認(rèn)證服務(wù)平臺(tái)等深入行業(yè)的解決方案,構(gòu)建了包括公有云服務(wù)、全智能能力平臺(tái)和全智能解決方案組成的產(chǎn)品生態(tài)體系。
  靈云人工智能產(chǎn)品生態(tài)
  靈云構(gòu)建的B2B2C商業(yè)模式,深入金融、電信、能源、交通、政務(wù)、公檢法等各個(gè)行業(yè),提供全方位的人工智能能力和解決方案。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  靈云支持云+端能力,也就是說(shuō)既可以用我們?cè)贫说哪芰,也可以用我們本地的能力,我們所有的技術(shù)都支持“云+端”的方式訪問(wèn),這樣就讓廣大的開(kāi)發(fā)者和企業(yè)合作伙伴能方便地調(diào)用各種應(yīng)用能力。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  在這些應(yīng)用當(dāng)中,我特意介紹一下我們?cè)诰S語(yǔ)和漢語(yǔ)的翻譯,因?yàn)樵谡Z(yǔ)音方面,我們除了中文普通話,我們還做了少數(shù)民族語(yǔ)言,同時(shí)構(gòu)建了十幾種國(guó)外的包括英文、法文、德文這樣的一些語(yǔ)音交互能力。維漢友誼橋這個(gè)翻譯APP,目前在新疆少數(shù)民族地區(qū),已經(jīng)有數(shù)百萬(wàn)用戶(hù)在使用,大大方便了我們漢族干部和少數(shù)民族間的交流,大家可以下載體驗(yàn)下。還有一個(gè)也是現(xiàn)在有幾百萬(wàn)用戶(hù)在使用的出國(guó)翻譯官,這個(gè)APP也是用了靈云上邊的各種能力,能夠方便的在出國(guó)的時(shí)候,你不管去哪個(gè)國(guó)家,有了這樣一個(gè)應(yīng)用就可以方便的和當(dāng)?shù)厝诉M(jìn)行交流,給大家的出行和旅游提供便利。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  我們一直強(qiáng)調(diào),現(xiàn)在AI技術(shù)的應(yīng)用實(shí)際上已經(jīng)不是單一能力的應(yīng)用。為什么講融合,AI的融合發(fā)展,實(shí)際上是現(xiàn)在我們遇到的很多應(yīng)用場(chǎng)景所需要的。在智能終端交互方面,比如說(shuō)現(xiàn)在我們做的機(jī)器人,它其中就用到了語(yǔ)音識(shí)別,語(yǔ)音合成,語(yǔ)義理解,人臉識(shí)別,甚至聲紋識(shí)別;在終端應(yīng)用的場(chǎng)景里邊,包括在家電,現(xiàn)在我們給家電廠商實(shí)際上也在提供一些除了語(yǔ)音交互之外的能力,大家提出來(lái)一些比如說(shuō)像聲紋識(shí)別、人臉識(shí)別等需求,包括在家庭的陪伴機(jī)器人、服務(wù)機(jī)器人方面,包括兒童陪伴機(jī)器人這塊,也提出了一些比如說(shuō)類(lèi)似圖像的識(shí)別、人臉的識(shí)別,包括視頻監(jiān)控等等這方面需求。這些需求,實(shí)際上就是人工智能的融合應(yīng)用。在捷通的靈云平臺(tái)上,如果用了我們這個(gè)平臺(tái)的話,這些能力都可以很方便的實(shí)現(xiàn)調(diào)用,因?yàn)殪`云平臺(tái)是一個(gè)開(kāi)放平臺(tái),我們的平臺(tái)能力,都能夠在開(kāi)發(fā)者社區(qū)上方便地調(diào)用。
  捷通構(gòu)建靈云平臺(tái)實(shí)際上是我們有一個(gè)愿景,就是希望能夠讓每一家企業(yè)都能夠擁有人工智能,希望每一個(gè)用戶(hù)都能夠享受人工智能帶來(lái)的便捷。源于這個(gè)目標(biāo),我們推出了靈云全智能能力平臺(tái),我們會(huì)和更多行業(yè)集成商、平臺(tái)廠商,一起來(lái)合作,為企業(yè)提供人工智能能力。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  在智能解決方案方面,我們推出了全智能客戶(hù)服務(wù)和靈云身份認(rèn)證平臺(tái)。我們推出的靈云全智能客戶(hù)服務(wù)是一種客服新模式,它包括了實(shí)體機(jī)器人、網(wǎng)絡(luò)版在線智能客服、電話客服機(jī)器人、智能語(yǔ)音導(dǎo)航等智能客服產(chǎn)品,以及智能語(yǔ)音分析、電話外呼機(jī)器人等呼叫中心行業(yè)解決方案,為用戶(hù)提供隨時(shí)隨地、隨手可及的智能客戶(hù)服務(wù),同時(shí)也大幅降低了企業(yè)的客服成本,提升了客戶(hù)服務(wù)效率和質(zhì)量。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  在身份認(rèn)證方面,隨著我們?nèi)四、聲紋、OCR技術(shù)的發(fā)展,我們推出了人證合一綜合“人臉識(shí)別+聲紋識(shí)別+指紋識(shí)別,OCR證照識(shí)別”的靈云身份認(rèn)證服務(wù)平臺(tái),這個(gè)系統(tǒng)已在人行的征信系統(tǒng)里得到應(yīng)用,F(xiàn)在單一生物特征識(shí)別技術(shù),比如說(shuō)人臉技術(shù),包括所有的人工智能技術(shù),大家很難說(shuō)做到100%。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  我們通過(guò)這樣多項(xiàng)技術(shù)的一個(gè)融合,識(shí)別時(shí)候我們可以把一個(gè)最小的出錯(cuò)概率集合到一個(gè)很小的數(shù)字集合上,比如說(shuō)我們通過(guò)人臉、聲紋、指紋可能有1%、2%這樣的錯(cuò)誤率,三種技術(shù)融合,再加OCR,人證合一,可以把這個(gè)錯(cuò)誤率降到萬(wàn)分之一,甚至更小。這就是我們推出的多維生物特征識(shí)別安全身份認(rèn)證平臺(tái),也是AI技術(shù)融合應(yīng)用的一個(gè)很好案例。
  融合能力 融合應(yīng)用 融合服務(wù) 是AI技術(shù)發(fā)展趨勢(shì)
  我們給一些公檢法包括政府部門(mén)在一些會(huì)議系統(tǒng)方面做了一些智能解決方案。一方面通過(guò)語(yǔ)音識(shí)別實(shí)現(xiàn)會(huì)議轉(zhuǎn)寫(xiě),解放了筆錄人員,降低速記員的一些勞動(dòng)強(qiáng)度;在整個(gè)會(huì)議系統(tǒng)里邊,實(shí)現(xiàn)電子簽到,利用我們現(xiàn)在手寫(xiě)筆跡技術(shù);通過(guò)人臉識(shí)別、身份證識(shí)別,確保參會(huì)者的身份;通過(guò)語(yǔ)音交互,我們可以輕松的來(lái)控制投影設(shè)備、燈光設(shè)備、包括大屏幕的一些切換;另外,通過(guò)語(yǔ)音識(shí)別和OCR的組合,可以把會(huì)議內(nèi)容實(shí)時(shí)結(jié)構(gòu)化轉(zhuǎn)寫(xiě),并且通過(guò)OCR把一些會(huì)議文件,自動(dòng)掃描錄入,全面、快速記錄會(huì)議內(nèi)容;還有,通過(guò)實(shí)時(shí)翻譯并語(yǔ)音播報(bào),把會(huì)議內(nèi)容同步聲音直播,這些場(chǎng)景在我們?cè)谝恍┱k公廳已經(jīng)實(shí)現(xiàn)了應(yīng)用。此外,像我們遇到的一些比如說(shuō)公檢法的辦公人員,他們可能每天要閱讀大量的文件,很費(fèi)眼睛,所以像我們的語(yǔ)音合成,他們就很受歡迎,這樣的話他可以去聽(tīng),邊聽(tīng)邊校,這樣就可以把他們的工作變得更加有趣,更加輕松。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  還有一個(gè)很有趣的是什么呢?比如說(shuō)現(xiàn)在我們給銀行做大廳服務(wù)機(jī)器人的時(shí)候,一方面通過(guò)語(yǔ)音交互來(lái)咨詢(xún)服務(wù),用智能客服系統(tǒng)來(lái)傳遞用戶(hù)需要的服務(wù)內(nèi)容。在機(jī)器人上邊,還實(shí)現(xiàn)了人臉識(shí)別、聲紋識(shí)別。對(duì)于一些VIP客戶(hù),剛剛到了銀行大廳,他可以通過(guò)人臉識(shí)別確認(rèn)身份,能夠更好的對(duì)這些VIP客戶(hù)提供服務(wù),這樣的話讓VIP客戶(hù)能夠到銀行以后感覺(jué)到一種新的感受。我們做這些能力,其實(shí)就是希望能夠讓這些設(shè)備更加智能化,有更多的功能來(lái)服務(wù)好用戶(hù)。
  合作理念:不與合作伙伴爭(zhēng)地盤(pán)
  另外捷通在十幾年的發(fā)展當(dāng)中,我們也在不斷總結(jié),我們的定位實(shí)際上就是做一個(gè)人工智能能力和解決方案的供應(yīng)商。我們有數(shù)千家的合作伙伴,包括我們?cè)陟`云平臺(tái)上服務(wù)了四億多用戶(hù),我們也希望能夠?qū)崿F(xiàn)一個(gè)準(zhǔn)確定位,構(gòu)建一個(gè)產(chǎn)業(yè)的生態(tài)。這方面和我們的合作伙伴共同探索一些服務(wù)運(yùn)營(yíng)模式,捷通是絕對(duì)不會(huì)去做和我們合作伙伴,合作企業(yè)爭(zhēng)地盤(pán)的事情,這是我們的一個(gè)明確定位,我們就把我們的人工智能的技術(shù)、產(chǎn)品、服務(wù)做好。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  靈云的愿景,就是讓機(jī)器“能說(shuō)會(huì)聽(tīng)、能寫(xiě)會(huì)看、能辨音會(huì)認(rèn)人、能思考會(huì)判斷”。我們希望能夠匯聚大家的力量,共同分享人工智能產(chǎn)業(yè)機(jī)遇。
從語(yǔ)音到全方位人工智能 AI技術(shù)的融合發(fā)展之路
  人工智能是長(zhǎng)跑企業(yè)的使命是將技術(shù)產(chǎn)業(yè)化
  另外,最后想跟大家分享一些思考。
  現(xiàn)在大家可能談到人工智能的時(shí)候,往往就會(huì)想到語(yǔ)音識(shí)別,實(shí)際上現(xiàn)在語(yǔ)音識(shí)別還有很多很多的工作和路要走,我非常認(rèn)同昨天錢(qián)博士提出的一些觀點(diǎn),我感覺(jué)就是說(shuō)人工智能本身是一個(gè)長(zhǎng)跑,這是一個(gè)沒(méi)有終點(diǎn)的長(zhǎng)跑,真的需要一些韌性,我們現(xiàn)在很多的技術(shù)不是說(shuō)不好,是沒(méi)有很好的去用,或者用的不好。另外一個(gè),可能大家對(duì)這些技術(shù)的期望值有點(diǎn)過(guò)高,也希望產(chǎn)業(yè)界能夠給像捷通這樣,包括其他的一些我們的同仁一些寬容,因?yàn)槿斯ぶ悄芗夹g(shù)本身還有很多的工作要做,還有很長(zhǎng)很長(zhǎng)的路要走。
  另外,其實(shí)現(xiàn)在大家看到的,這些基礎(chǔ)性研究,不管從國(guó)外還是國(guó)內(nèi),實(shí)際上在一些基礎(chǔ)性的研究尤其是一些方法理論性的研究,主要還是來(lái)自于大學(xué),這也就是為什么靈云和清華大學(xué),捷通華聲和清華大學(xué)建立“靈云科技源自清華”深度合作的原因。我們?cè)谇迦A大學(xué)建了靈云人工智能研究中心,我們有十幾位教授,把他們幾十年來(lái)的研究,積淀的一些東西與產(chǎn)業(yè)結(jié)合,把這些技術(shù)成果應(yīng)用起來(lái)。但是基礎(chǔ)研究的工作,企業(yè)去做恐怕不是太容易,我們還是應(yīng)該把這些基礎(chǔ)研究的工作交給我們這些教授們,專(zhuān)家學(xué)者們?nèi)プ觥?/div>
  那么企業(yè)應(yīng)該做的是什么呢?我們應(yīng)該做的是一些應(yīng)用型的研究,包括一些產(chǎn)業(yè)化的研究,企業(yè)應(yīng)該結(jié)合產(chǎn)業(yè),把我們現(xiàn)在目前能夠?qū)崿F(xiàn)的一些人工智能技術(shù)很好地轉(zhuǎn)化到應(yīng)用當(dāng)中去,我覺(jué)得這是我們企業(yè)的使命。
  人工智能技術(shù)的應(yīng)用市場(chǎng)很廣闊,但是我也感覺(jué),因?yàn)槲覐臉I(yè)也有二十幾年了,在這個(gè)領(lǐng)域里邊,人工智能技術(shù)我個(gè)人感覺(jué),從技術(shù)本身來(lái)講,不是非常適合于創(chuàng)業(yè)團(tuán)隊(duì),去拿這個(gè)技術(shù)去創(chuàng)業(yè)。因?yàn)檫@是燒錢(qián)的事,這是燒錢(qián)的行當(dāng),我想資本界也應(yīng)該能夠看到這一點(diǎn),這不是個(gè)黃金坑,大家跳下去不那么容易上來(lái)。捷通做人工智能,其實(shí)也是經(jīng)歷了十幾年這樣的一個(gè)歷程。
  最后,我用我們這個(gè)小機(jī)器人唱“五星紅旗”來(lái)結(jié)束我今天的分享,謝謝大家。
悅耳歌聲源自靈云歌唱語(yǔ)音合唱技術(shù)
  鈦媒體是國(guó)內(nèi)首家TMT公司人社群媒體,最有鈦度的一人一媒體平臺(tái),集信息交流融合、IT技術(shù)信息、新媒體于一身的媒體平臺(tái)。鈦坦白,作為鈦媒體旗下的微信公開(kāi)課,匯集行業(yè)大牛鈦客,分享行業(yè)干貨。
  靈云平臺(tái)更多信息:www.AIcloud.com
  體驗(yàn)靈云客服機(jī)器人:010-82826886-8898

專(zhuān)題

宜川县| 阿坝县| 开阳县| 保定市| 文山县| 泗洪县| 逊克县| 湖州市| 公主岭市| 兴和县| 保靖县| 怀仁县| 克什克腾旗| 玛曲县| 兰西县| 富裕县| 门头沟区| 黔江区| 滨州市| 镇赉县| 自治县| 黄陵县| 六枝特区| 夹江县| 武定县| 康定县| 武乡县| 岳西县| 东丽区| 洞头县| 临安市| 保山市| 哈巴河县| 尼玛县| 奉贤区| 绵阳市| 南靖县| 云和县| 东光县| 盘锦市| 扬中市|