信息技术与系统

中文学科术语相关语义关系获取方法研究*

  • 朱 惠 杨建林 王 昊
展开
  • 1.南京大学信息管理学院   
    2.江苏省数据工程与知识服务重点实验室
朱惠(1979-),女,南京大学信息管理学院讲师,博士,研究方向:信息智能处理与检索、知识本体构建及应用、数据挖掘;杨建林(1970-),男,南京大学信息管理学院教授,研究方向:信息智能处理与检索、信息分析评价、数据挖掘;王昊(1981-),男,南京大学信息管理学院教授,研究方向: 信息智能处理与检索、知识本体构建及应用、科学评价和引文分析。

收稿日期: 2016-10-08

  网络出版日期: 2017-05-19

基金资助

*本文系江苏省社会科学基金一般项目“领域术语语义关系自动获取研究”(项目编号:15TQB009)与国家自然科学基金青年项目“面向学术资源的TSD与TDC测度及分析研究”(项目编号:71503121)研究成果之一。

Research on the Methods of Extracting Non-taxonomic Relation of Chinese Discipline Terms

  • Zhu Hui Yang Jianlin Wang Hao
Expand

Received date: 2016-10-08

  Online published: 2017-05-19

摘要

:文章对中文非结构化文本中(半)自动获取学科术语的相关语义关系进行了探讨,以寻找行之有效的获取方法。从CNKI获取“数字图书馆”学科领域文献,通过术语抽取、动词抽取、向量空间模型构建、双重关联规则分析和规则评价获得了具有较强关联的术语对以及作为关联标签的动词,从而获取了学科术语的相关语义关系。该获取方法与其他方法相比,具有较高的可行性和有效性,并对术语的相关语义关系进行了有效性和实用性的评价,提高了获取的准确率。但文章也存在一定的局限性,在对术语相关语义关系的有效性和实用性进行评价时,指标的选择和阈值的确定存在人工干预,具有一定的主观性。

本文引用格式

朱 惠 杨建林 王 昊 . 中文学科术语相关语义关系获取方法研究*[J]. 图书与情报, 2017 , 37(02) : 125 -132 . DOI: 10.11968/tsyqb.1003-6938.2017041

Abstract

This paper discusses how to (semi-)automatically extract non-taxonomic relation of discipline terms from Chinese unstructured text so as to find feasible and effective extracting methods. First, papers of Digital Library are retrieved from CNKI; then terms and transitive verbs are extracted; third, vector space models are constructed; fourth, association rules are analyzed and evaluated; and last, the term pairs with stronger relation are acquired and the transitive verbs used as the labels of relation, thus the non-taxonomic relation of Chinese discipline terms is extracted. The above method is more feasible and effective than other methods, and it can improve the extracting accuracy by evaluating the effectiveness and practicality. This paper of course has limits. When evaluating the effectiveness and practicality of association rules, the indicators and thresholds are determined by manual intervention, so the method has subjectivity to some extent.  
文章导航

/