周雷,李颖,石崇德.汉语科技词汇构词研究初探[J].情报工程,2015,1(3):064-075 |
汉语科技词汇构词研究初探 |
An Exploration on Chinese Word Formation in Science and Technology |
|
DOI:10.3772/j.issn.2095-915X.2015.03.009 |
中文关键词: 汉语科技词汇,构词法,词标注 |
英文关键词: Chinese science and technique terms, word formation, word tagging |
基金项目:国家自然科学基金项目“面向科技监测的实体识别与关系抽取研究”(编号:71403257) |
作者 | 单位 | 周雷 | 中国科学技术信息研究所 | 李颖 | 中国科学技术信息研究所 | 石崇德 | 中国科学技术信息研究所 |
|
摘要点击次数: 6120 |
全文下载次数: 5567 |
中文摘要: |
基于机器学习的分词模型可以借助科技词汇构词特征分析提升其在科技领域的适应性,本文对传统语言学的句法构词、韵律构词、语义构词几个方面理论进行总结归纳,融合术语学研究理论,围绕提升分词准确率的目的,提出了适用于科技词汇的构词特征标注系统,并对标注系统的结构进行了规划。这为科技词汇构词特征标注工作完成了前期的探索,为后期批量标注,辅助分词等环节提供了基础依据。 |
英文摘要: |
To improve the adaptability of word segmentation model in S&T domain, more features of S&T terms are needed. Based on the exploration on syntactic, rhetoric and semantic method of word formation, as well as terminology, tags are extracted and a labeling system is roughly designed aiming at improving the accuracy of word-parsing system. The research work on S&T word formation is not only the preliminary exploration of S&T terms tagging, but also the foundation of large size tagging and word segmentation. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |