邰杨芳,王紫琼,刘慧芳,李迎娟.基于标签与短评数据的用户标注行为特征分析[J].情报工程,2023,9(4):068-078 |
基于标签与短评数据的用户标注行为特征分析 |
Analysis on Users Labeling Behavior Characteristics Based on Tags and Short Comments Data |
|
DOI:10.3772/j.issn.2095-915X.2023.04.006 |
中文关键词: 标签;短评;用户标注行为;相关性分析 |
英文关键词: Tags; Short Comments; User Labeling Behavior; Correlation Analysis |
基金项目:2021年山西省高等学校教学改革创新项目“医学高校学生科学数据素养教育课程体系建设与教学实施的探索”(J2021260),山西医科大学 2020 年度一流专业建设专项校级教育教学改革一般研究项目“医学高校学生科学数据素养教育课程体系建设与教学实施的探索”(SXJ202078);山西省软科学研究计划一般项目“大数据环境下基于分布式的病案信息协同管理研究”(2017041035-7)。 |
作者 | 单位 | 邰杨芳 | 山西医科大学管理学院 太原 030001 | 王紫琼 | 山西医科大学管理学院 太原 030001 | 刘慧芳 | 山西医科大学管理学院 太原 030001 | 李迎娟 | 山西医科大学管理学院 太原 030001 |
|
摘要点击次数: 664 |
全文下载次数: 760 |
中文摘要: |
[目的/意义] 基于标签与短评文本数据探究用户的标注行为规律,为优化社会化标注系统的功能和服务提供参考和理论依据。[方法/过程] 采用自主编写的 Python 代码抓取 “ 豆瓣读书 ” 平台健康类目下的图书标签与短评数据,运用统计学方法和自然语言处理技术对用户的标签标注行为与评论行为进行分析。[ 结果 / 结论 ] 用户偏向使用字符长度为 2~5,词性为名词、动词与形容词的标签对健康类图书信息进行标注,在标签词的选用上呈现出一定的用词规律和词性偏好;无论从单本图书还是整体图书来看,短评文本的情感值与资源的星级评分都具有显著相关;从整体图书而言,星级评分与评论有用性感知得分呈极弱正相关,短评文本的情感值与评论有用性感知得分呈极弱负相关。用户对信息资源的文本评论、星级评分和有用感知行为都具有评价资源的作用,并且它们之间具有一定关联性。本文据此为社会化标注系统平台提高用户体验提出相关建议。 |
英文摘要: |
[Objective/Significance] To explore the rules of users’ labeling behavior based on the data of tags and short comments, and to provide reference and theoretical basis for optimizing the functions and services of the social labeling system. [Methods/Processes] Through the self-developed Python code this paper captures the book tags and short comments data under the health category of the “Douban Reading” platform, applies statistical methods and natural language processing techniques to analyze the user’s tag labeling behavior and comment behavior. [Results/Conclusions] Users tend to tag health books with characters lengths of lengths 2-5 and part of speech of nouns, verbs and adjectives,Users show certain lexical rules and parts-of speech preference in choosing tag words; Whether from the perspective of a single book or the whole books, the emotional value of the short review text is significantly related to the star rating of the resources. In terms of the overall book, the star rating was extremely weak positive correlation with the review usefulness perception score, and the emotional value of the short review text was extremely weak negative correlation with the review usefulness perception score. Users’ text comments, star ratings and useful perceptual behaviors on information resources all play a role in evaluating resources, and they are related to each other. Therefore, this paper puts forward relevant suggestions for improving user experience of social labeling system platform. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |