李春梅,李艾丹,薛中玉,韩爽.Web 数据挖掘中数据异构问题解决方法的研究[J].中国科技资源导刊,2012,(4):85~90 |
Web 数据挖掘中数据异构问题解决方法的研究 |
Research on Heterogeneous Data Problem Solving Method in the Process of Web Data Mining |
投稿时间:2012-03-26 |
DOI: |
中文关键词: 数据挖掘;半结构化;XML技术;数据抽取;模型 |
英文关键词: data mining, semi-structured, XML technology, data extraction, mode |
基金项目:国家国际科技合作计划项目“异构信息知识挖掘与可视化关键技术研究”(2010DFA14390)。 |
作者 | 单位 | 李春梅,李艾丹,薛中玉,韩爽 | 1.北京中机科海科技发展有限公司,北京 100048;2.北京理工大学,北京 100081 |
|
摘要点击次数: 5194 |
全文下载次数: 5939 |
中文摘要: |
Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据
分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML
(可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模
型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。 |
英文摘要: |
The web was an information resource with dynamic state, to access and analyze the data we must study
how to integrate heterogeneous architecture data and choose fit techniques to analyze, manage and integrate the data.
How to apply plentiful web data to the field of web data mining has been brought into focus. The article discusses the
data heterogeneity problem in Web by introducing the application of XML in the field of web data mining. By using
XML technology a data extraction model is established for solving most of the difficulties in Web data mining caused
by heterogeneous, unstructured problems on Internet. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |