NLPIR大數據語義智能分析平臺在文本信息提取介紹方面,能夠實現新詞提取和關鍵詞提取。
新詞發現能從文本中挖掘出具有內涵的新詞、新概念,用戶可以用于專業詞典的編撰,還可以進一步編輯標注,導入分詞詞典可提高分詞系統的準確度,并適應新的語言變化。新詞提取內容包括:詞語、詞性、權重和詞頻統計。本步驟所得到的新詞, 可以作為分詞標注器的用戶詞典導入,從而使分詞結果更加準確。
關鍵詞提取能夠對單篇文章或文章集合,提取出若干個代表文章中心思想的 詞匯或短語,可用于精化閱讀、語義查詢和快速匹配等。關鍵詞提取能夠對單篇文章或文章集合,提取出若干個代表文章中心思想的 詞匯或短語,可用于精化閱讀、語義查詢和快速匹配等。關鍵詞分析內容包括: 詞語、詞性、權重和詞頻統計。系統默認詞匯以權重值高低排序。
同時,NLPIR大數據語義智能分析平臺能夠實現對于新詞、關鍵詞提取結果的高維可視化展示,可視化形式有三種:文 本格式、二維格式與三維格式。用戶可根據需要直接使用,無須再次設計美化。
|