王末
- 作品数:4 被引量:34H指数:3
- 供职机构:中国科学院地理科学与资源研究所更多>>
- 发文基金:国家科技基础条件平台建设计划云南省科技计划项目科技基础性工作专项更多>>
- 相关领域:自动化与计算机技术经济管理天文地球更多>>
- 国家地球系统科学数据共享平台数据分类编目与特征分析被引量:3
- 2015年
- 数据分类编目在数据共享平台管理中发挥着核心作用。以已建立的“面向共享的地球系统科学数据分类”为基础,实现了国家地球系统科学数据共享平台1832条数据集的实体分类编目,定量分析数据共享平台数据资源在分类体系内和各分平台内的分布特征,提出潜在的数据资源建设策略建议。研究产生的数据分类编目体系已在国家地球系统科学数据共享平台新版平台实现在线管理和应用。
- 王卷乐宋佳卜坤王末赵红伟田奋民柏永青
- 关键词:地球系统数据共享数据资源建设
- Web环境下地学数据共享用户行为模式分析被引量:9
- 2016年
- 了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间"热点"分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与"211工程"高校学生的空间分布相关度较高;(2)空间"热点"分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是"热点"区域,但识别的"冷点"区域有较大不同,尤其是数据访问"冷点"分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。
- 王末王卷乐
- 关键词:网络数据挖掘空间数据挖掘用户行为模式科学数据共享
- 关于制定“数字‘丝绸之路经济带’与信息化基础设施建设科技支撑计划”的思考被引量:15
- 2015年
- "丝绸之路经济带"(简称"丝路")是世界上最长、最具有发展潜力的经济大走廊,对于沿线国家甚至是全球发展意义重大。大数据时代下,"丝路"的建设必须依靠先进的信息技术和丰富的信息资源,加快和提升跨境合作的效率和水平,培育区域发展新的经济增长点,支撑区域可持续发展。文章首先分析了"丝路"建设的信息化需求,提出了由信息化基础设施、数字"丝路"和大数据计算分析中心3个层次构成的"丝路"信息化建设总体架构。建议尽快启动"数字丝绸之路与信息化基础设施建设及重大应用示范科技支撑计划"。
- 诸云强孙九林董锁成王末赵红伟罗侃郭春霞
- 关键词:信息高速公路物联网云计算
- 地学数据共享网用户Web行为预测及数据推荐方法被引量:7
- 2017年
- 网络环境下,如何让用户快速发现所需数据是地学数据共享平台长期面临的挑战之一。本文基于国家地球系统科学数据共享平台网站服务器日志数据获取用户搜索行为及数据集访问行为,使用聚类算法挖掘用户行为模式,并基于会话聚类模式开发在线搜索和访问预测算法。在数据预处理阶段,对原始服务器日志数据进行清洗、用户识别、用户会话识别、搜索词提取。在模式挖掘阶段,采用DBSCAN算法对会话进行聚类。考虑到会话向量值的二元性,聚类算法中的距离采用Jaccard距离函数计算。视每个会话聚类包含的搜索词集合为一个文本,所有用户历史搜索词集合为语料库,统计各聚类中搜索词的TF-IDF值。在线搜索推荐,以搜索词检索各聚类中TF-IDF值,返回TF-IDF值最高的搜索词所属聚类,并给出该聚类的高频项目作为推荐。在线访问推荐,则以用户实时访问向量为查询向量,计算该向量与聚类中心的聚类。根据聚类排序,给出距离最近的聚类,并产生该聚类中高频项目作为推荐。实验结果表明基于TF-IDF和聚类的搜索推荐有较高的准确率和召回率,访问推荐效果基于高频统计的推荐有较大提高。研究可得出以下结论:(1)地学共享网用户访问和搜索行为体现了专业性的特点,其行为较普通网站用户可预测性更好;(2)对于地学数据共享用户行为预测,需明确定义用户行为,并采用合适的距离函数描述行为相似性;(3)通过搜索词TF-IDF值来预测用户数据需求的方法可行,以此产生的推荐可作为搜索结果的补充。本研究可服务于地学领域数据共享平台建设,提高共享服务质量,也可为其他领域科学数据共享提供技术方法借鉴。
- 王末王卷乐赫运涛
- 关键词:网络数据挖掘用户行为模式科学数据共享