公司動(dòng)態(tài)
億迅科技之基于文本語言理解的語義智能分析平臺(tái),助力政務(wù)服務(wù)智慧化
政務(wù)熱線話務(wù)量每年上升,期間產(chǎn)生的數(shù)據(jù)量、信息量非常巨大,如何更好的利用這些數(shù)據(jù),讓政府更好的結(jié)合經(jīng)濟(jì)、社會(huì)發(fā)展的熱點(diǎn)問題,有效推動(dòng)市場(chǎng)發(fā)展、為政府決策提供有力支撐?這個(gè)問題值得認(rèn)真琢磨。
以前政府處理這些數(shù)據(jù)需要耗費(fèi)大量的人力、物力,花費(fèi)大量時(shí)間去整理話務(wù)員記錄的內(nèi)容,需人工提取信息、分類整合;在監(jiān)聽工作方面,需要耗費(fèi)大量的人力、時(shí)間去重新聽取話務(wù)員錄音,記錄相關(guān)內(nèi)容,評(píng)價(jià)話務(wù)員的工作態(tài)度等等。
億迅科技之基于文本語言理解的語義智能分析平臺(tái)(以下簡(jiǎn)稱“語義智能分析平臺(tái)”),基于主題模型,word2vec,textRank,CRF等主流語義分析算法,提供精準(zhǔn)的文本分析服務(wù)。主要包括實(shí)體識(shí)別、情感分析、文本摘要、關(guān)鍵詞提取、詞義聯(lián)想、主題聚類等功能。
一、實(shí)體識(shí)別
從文本中發(fā)現(xiàn)的有意義實(shí)體,如人名、地名、公司名、產(chǎn)品名、時(shí)間等。命名實(shí)體識(shí)別是信息提取、問答系統(tǒng)、句法分析、機(jī)器翻譯、面向Semantic Web的元數(shù)據(jù)標(biāo)注等應(yīng)用領(lǐng)域的重要基礎(chǔ)工具,在自然語言處理技術(shù)走向?qū)嵱没倪^程中占有重要地位。
二、情感分析
對(duì)文本中含有的情感信息進(jìn)行分析,提取情感的正負(fù)面傾向性。平臺(tái)采用基于情感詞典和基于統(tǒng)計(jì)綜合進(jìn)行情感分析。針對(duì)短文本的情感分析比單純利用其中一種方式效果更好。
三、文本摘要
抽取文本中已經(jīng)存在的關(guān)鍵句子形成摘要。對(duì)文本進(jìn)行分句處理后,分析每個(gè)句子的重要性,根據(jù)重要性進(jìn)行排序。根據(jù)摘要的百分比系數(shù),輸出屬于該系數(shù)排名內(nèi)的句子作為摘要。
四、關(guān)鍵詞提取
從文本中提取出代表性的關(guān)鍵詞。平臺(tái)綜合考慮詞語在文本中的頻率,所屬主題分類的背景關(guān)鍵詞因素,提取能代表文本的詞語。
五、詞義聯(lián)想
文本抽取的關(guān)鍵詞作為輸入,利用平臺(tái)千萬級(jí)的豐富語料數(shù)據(jù)模型找到相關(guān)聯(lián)的關(guān)聯(lián)詞,并得到關(guān)聯(lián)系數(shù)。關(guān)聯(lián)系數(shù)越高,表示與關(guān)鍵詞的關(guān)聯(lián)程度越高。
六、主題聚類
把一組無主題的文檔,根據(jù)內(nèi)容的相似程度進(jìn)行聚類,把語義相似的歸為一類主題。平臺(tái)利用隱含狄利克雷分布模型,經(jīng)過優(yōu)化的特征提取技術(shù),使得聚類效果比傳統(tǒng)的模型較好。
億迅科技承建的廣東省12345投訴舉報(bào)數(shù)據(jù)分析研判平臺(tái),該平臺(tái)對(duì)話務(wù)員記錄的內(nèi)容進(jìn)行分析,通過提取關(guān)鍵詞,對(duì)投訴主題進(jìn)行智能分類;通過實(shí)體識(shí)別,對(duì)內(nèi)容中出現(xiàn)的人名、地名、產(chǎn)品名等信息,整理出投訴的熱點(diǎn)、熱詞;通過文中的情感信息進(jìn)行分析,提取情感正負(fù)面傾向,基于情感詞典與統(tǒng)計(jì)綜合,分析投訴者的情感,以及對(duì)服務(wù)滿意度表現(xiàn)。該平臺(tái)結(jié)合語義智能分析平臺(tái)的應(yīng)用,節(jié)省大量的人力成本、時(shí)間,快速整合分析,及時(shí)了解投訴熱點(diǎn)、熱詞,讓政府快速?zèng)Q策,提升政府治理效率。政府通過對(duì)各地市12345話務(wù)、工單信息進(jìn)行實(shí)時(shí)監(jiān)測(cè),便于從全省層面及時(shí)了解各地市情況及熱點(diǎn)突發(fā)問題,實(shí)現(xiàn)市場(chǎng)監(jiān)管熱點(diǎn)難點(diǎn)分析、消費(fèi)熱點(diǎn)預(yù)警、消費(fèi)趨勢(shì)預(yù)測(cè)、效能監(jiān)察問題等多項(xiàng)工作,為政府決策提供可靠依據(jù),提高政府治理能力。
億迅科技之基于文本語言理解的語義智能分析平臺(tái)為文本處理提供基礎(chǔ)的文本處理工具及分析和挖掘工具,快速結(jié)合客戶的文本數(shù)據(jù),實(shí)現(xiàn)快捷、高效精準(zhǔn)的文本挖掘,幫助客戶挖掘隱藏的業(yè)務(wù)價(jià)值。未來,億迅科技也將努力成為中國(guó)電信IT智慧運(yùn)營(yíng)的建設(shè)者和傳播者以及云改時(shí)代新興業(yè)務(wù)增長(zhǎng)極的主力軍。