曲春燕,关毅,杨锦锋,赵永杰,刘雅欣.中文电子病历命名实体标注语料库构建[J].高技术通讯(中文),2015,25(2):143~150 |
中文电子病历命名实体标注语料库构建 |
|
|
DOI: |
中文关键词: 中文电子病历(CEMR), 命名实体, 标注语料库, 标注规范, 标注一致性(IAA) |
英文关键词: |
基金项目: |
|
摘要点击次数: 4558 |
全文下载次数: 4112 |
中文摘要: |
针对中文电子病历命名实体语料标注空白的现状,研究了中文电子病历命名实体标注语料库的构建。参考2010年美国国家集成生物与临床信息学研究中心(I2B2)给出的电子病历命名实体类型及修饰类型的定义,在专业医生的指导下制定了详尽的中文电子病历标注规范;通过对大量中文电子病历的分析,提出了一套完整的中文电子病历命名实体标注方案,而且采用预标注和正式标注的方法,建立了一定规模的中文电子病历命名实体标注语料库,其标注语料的一致性达到了92%以上。该工作对中文电子病历的命名实体识别及信息抽取研究提供了可靠的数据支持,对医疗知识挖掘也有重要意义。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|