a级片网址,www.一级毛片,日批国产,中文字幕日韩精品有码视频,黄色毛片免费网站,久久久精品午夜免费不卡,天堂福利视频

您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

面向NLP場景應(yīng)用的智能輔助建模(一)簡介

2019-05-08 15:37:56   作者:晉耀紅   來源:“泰岳語義工廠”微信公眾號   評論:0  點擊:


  之前的文章“NLP場景應(yīng)用中的本體論”中提到,場景本體(也稱為“OEC模型”)是面向場景的形式化模型,是以本體論為指導(dǎo),對場景應(yīng)用中,NLP語義分析的業(yè)務(wù)目標(biāo)(需求)進行形式化描述,并對場景相關(guān)的領(lǐng)域模型、要素模型、概念模型進行形式化描述,提高場景知識的共享、復(fù)用能力。
  智能輔助建模(也稱為“OEC智能輔助建模”)將介紹如何利用機器學(xué)習(xí)算法和語義資源,輔助場景業(yè)務(wù)人員,自動或半自動化地構(gòu)建具體場景應(yīng)用中的OEC模型。本文是輔助建模系列文章的第一篇,將介紹輔助建模的概念、工具和基本功能。
  一個場景模型示例
  在下邊這個本體場景實例,是銀行領(lǐng)域客服投訴分析挖掘的場景本體模型,可用于對銀行客服投訴進行自動分析。輸入是客服投訴文本,是自然語言表示的文本,輸出結(jié)果是客服投訴的自動分類。
  客服投訴模型,包括3部分:
  1、本體模型:形式上由一個本體樹和領(lǐng)域模型構(gòu)成。本體樹是類目體系的形式化描述,這里指客服投訴的分類。領(lǐng)域模型,是本體樹對應(yīng)的推理規(guī)則的形式化描述,這里指客服投訴分類相關(guān)的業(yè)務(wù)知識。領(lǐng)域模型支持兩種類型:概念模型、機器學(xué)習(xí)預(yù)訓(xùn)練模型。上圖中的“本體表達式”,是概念模型的形式化規(guī)則,說明客服投訴的業(yè)務(wù)知識,一般是用“客服人員-態(tài)度-不好”這樣的三元組表示,其中“客服人員”是投訴對象要素,“態(tài)度”是投訴涉及的屬性要素,“不好”是投訴中對投訴對象涉及屬性的評價性描述。
  2、要素模型:是對領(lǐng)域相關(guān)實體概念的形式化描述。這里指銀行領(lǐng)域相關(guān)投訴對象(對象要素)、投訴對象相關(guān)屬性(屬性要素)。如工作人員的對象要素,可包括下級要素,如“柜員、客服人員、保安、大堂經(jīng)理”等,工作人員的屬性要素,可包括下級要素如“態(tài)度、效率、業(yè)務(wù)水平”等。
  3、概念模型:是對領(lǐng)域無關(guān)的語言概念的形式化描述。這里指對象和屬性的評價概念,如“不好、惡劣、怠慢”等。概念模型可理解為傳統(tǒng)意義上的語言資源形式化管理。
  場景本體輔助建模
  場景本體模型是業(yè)務(wù)知識的形式化表示,一般由業(yè)務(wù)人員主導(dǎo)構(gòu)建。面向場景應(yīng)用開發(fā)的工具——DINFO-OEC平臺,提供專業(yè)、方便、易用的建模IDE集成環(huán)境,支持場景化業(yè)務(wù)建模,可通過概念規(guī)則,構(gòu)建形式化的業(yè)務(wù)規(guī)則,也可通過數(shù)據(jù)標(biāo)注,指定機器學(xué)習(xí)(包括深度學(xué)習(xí))算法,來訓(xùn)練機器學(xué)習(xí)模型。建模工具支持兩種類型領(lǐng)域模型。
  為了提高建模效率,DINFO-OEC平臺也提供OEC智能輔助建模工具,支持利用機器學(xué)習(xí)算法,對業(yè)務(wù)數(shù)據(jù)進行自動學(xué)習(xí)。輔助建模中涉及到的機器學(xué)習(xí)算法(包括深度學(xué)習(xí))、知識資源及各種功能模塊,均由DINFO-OEC平臺提供。
  輔助建模工具
  輔助建模工具,提供可視化輔助建模環(huán)境,支持業(yè)務(wù)人員通過拖拉拽的方式,實現(xiàn)各種建模操作。
  輔助建模工具的3個分區(qū):
  1、組件區(qū):在建模工具左下角。該區(qū)提供相關(guān)算法組件,如用于本體模型輔助的分類聚類,用于要素模型、概念模型中的實體抽取,用于本體模型中本體表達式輔助的關(guān)聯(lián)發(fā)現(xiàn)、規(guī)則生成等組件。每個組件對可以對應(yīng)一個或多個算法,業(yè)務(wù)人員無須了解算法的具體細(xì)節(jié),只需要在輔助建模工具中拖拽組件(如分類、聚類組件),即可完成自動聚類的任務(wù)。組件區(qū)也提供建模常用操作,如選擇語料,可以選擇客服投訴語料來作為輔助建模的數(shù)據(jù)等。
  2、建模區(qū):在建模工具左上方。該區(qū)支持業(yè)務(wù)人員將組件區(qū)的組件和操作,通過拖拉拽的方式,形成一個處理流程,用以實現(xiàn)多級建模。
  3、結(jié)果區(qū):在建模工具右方。該區(qū)展示當(dāng)前流程的輸出結(jié)果,業(yè)務(wù)人員可對結(jié)果進行合并、修改、刪除等操作。
  輔助建模功能示例
  以上述客服投訴模型為例,輔助建模工具在以下4個環(huán)節(jié)中,支持業(yè)務(wù)人員對客服投訴的文本數(shù)據(jù)進行分析,提高客服投訴模型的建設(shè)效率:
  1、分類體系建模:針對本體模型中本體樹建設(shè),輔助自動發(fā)現(xiàn)本體樹節(jié)點。
  2、要素發(fā)現(xiàn):針對要素模型中要素樹建設(shè),輔助自動發(fā)現(xiàn)客服投訴場景下的實體對象。
  3、評價概念復(fù)用:針對概念樹中概念樹建設(shè),可直接復(fù)用平臺提供的語言資源。
  4、本體表達式發(fā)現(xiàn):針對本體模型中,一個本體樹節(jié)點的業(yè)務(wù)規(guī)則,從客服投訴文本中,輔助發(fā)現(xiàn)要素與概念的組合關(guān)系,自動形成本體表達式。
作者:晉耀紅博士,神州泰岳首席科學(xué)家,人工智能研究院院長,北京師范大學(xué)教授,博士生導(dǎo)師。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)

井陉县| 甘孜县| 元谋县| 会昌县| 望奎县| 英德市| 大方县| 习水县| 牡丹江市| 宁城县| 灵川县| 锦屏县| 宿迁市| 澳门| 天峨县| 苗栗县| 驻马店市| 洪洞县| 会昌县| 阳朔县| 临澧县| 忻城县| 南汇区| 泌阳县| 沙田区| 房山区| 扎囊县| 牙克石市| 龙海市| 鄂尔多斯市| 抚松县| 聂拉木县| 盐亭县| 南岸区| 宜兰市| 陆川县| 离岛区| 苏尼特右旗| 额敏县| 天水市| 司法|