张越 刘琦岩 张玄玄 望俊成.科技成果转化政策文本中的领域关键词汇提取研究[J].中国科技资源导刊,2018,(3):68~75 |
科技成果转化政策文本中的领域关键词汇提取研究 |
Methods of Domain Keywords Extraction in the Policy of Transformation ofScientific and Technological Achievements Based on Hybrid Index |
|
DOI: |
中文关键词: 科技成果转化;政策文本;混合指标;领域关键词汇;信息抽取 |
英文关键词: transformation of scientific and technological achievements, policy texts, hybrid indicators, domain
keywords, information extraction |
基金项目:中国科学技术信息研究所创新基金“政策亮点挖掘模型的构建——以科技成果转化政策文本为例”(QN2017-01)。 |
作者 | 单位 | 张越 刘琦岩 张玄玄 望俊成 | (中国科学技术信息研究所,北京 100038) |
|
摘要点击次数: 1116 |
全文下载次数: 1309 |
中文摘要: |
为了解决政策文本研究领域尚未建立其关键词表的问题,尝试利用语法分析特征,挖掘核心词汇构成模
式,构建政策文本核心词汇的抽取模型,采用基于混合指标的政策领域关键词汇抽取和结果筛选方法对关键词进行识
别,最后在科技成果转化政策上对该方法进行实证研究。结果表明,该方法可以从政策文本中发掘出潜在的信息,为
政策内容分析和决策支持提供数据基础与效率支撑 |
英文摘要: |
The keywords table in the policy domain is not yet established. We try to solve this problem by
analyzing the characteristics of grammar, mining structure pattern of keywords, constructing the extraction
model of the core vocabulary of the policy text, using the methods of keywords extraction and results screening
in the policy domain based on hybrid index. Finally, we make an empirical study in the policy of transformation
of scientific and technological achievements. The results show that the method can discover potential
information from the policy text and provide data basis and efficiency brace for policy content analysis and
decision support |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |