高云君 作品数:84 被引量:162 H指数:6 供职机构: 浙江大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 云南省科技攻关计划 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 理学 更多>>
一种基于MapReduce的度量空间相似连接处理方法 本发明公开了一种基于MapReduce的度量空间相似连接处理方法。本发明基于MapReduce分布式计算框架,设计高效的度量空间相似连接处理方法,对重复冗余的数据进行检测和删除。本发明先在Map阶段对给定的数据集进行划分... 高云君 杨克宇 陈璐 陈刚 陈纯文献传递 网站信息动态发布系统(WIDPS)的设计与实现 被引量:1 2004年 对网站信息动态发布系统的开发背景、当前流行的开发技术、设计原则、体系结构模型、需解决的关键技术、功能流程、存在的问题及今后发展方向做了一个概述,提出了一个易移植、适应性强、易用性高的基于JAVA和XML的网站信息动态发布系统的设计与实现. 高云君 张学杰关键词:系统设计 时空数据库查询处理关键技术研究 移动计算、无线通信以及定位技术的快速发展使得对各种空间与时空对象的存储和管理成为了现实需求。大量的应用领域(如地理信息系统、智能导航、交通管制、天气预报、军事、移动电子商务等)均迫切需要有效地查询这些数据对象。然而,空间... 高云君关键词:时空数据库 查询处理 查询算法 一种有效的历史移动对象轨迹的k最近邻居查询算法 近10多年来,研究者们已经在k最近邻居(kNN)查询方面做了很多工作,但是对于移动对象轨迹的kNN查询处理却研究得很少.鉴于此,研究了在存储有历史移动对象轨迹信息的TB树结构上的kNN查询问题,并且提出了一种有效的基于最... 高云君 李春 陈根才 姜贤塔 陈岭 陈纯关键词:查询处理 移动对象轨迹 文献传递 XML技术在电子政务信息交换中的应用研究 被引量:16 2003年 随着信息与通信技术的迅猛发展 ,电子政务已成为当前我国信息化建设的首要任务。文中先分析目前电子政务信息交换中存在的主要问题及其应用需求 ,提出了基于XML技术的电子政务信息交换实现方式 ;接着从数据表示、数据格式转换、数据传输、信息交换体系结构及其实现四个方面具体阐述了XML技术在电子政务信息交换中的应用。 高云君 张学杰 章方铭关键词:电子政务 数据表示 数据格式转换 数据传输 大数据环境下移动对象自适应轨迹预测模型 被引量:29 2015年 已有的轨迹预测算法针对移动对象运动模式,使用数学模型进行交通流模拟,难以对路网中的移动对象进行准确的描述.为了解决这一问题,提出基于隐马尔可夫模型(hidden Markov model,简称HMM)的自适应轨迹预测模型SATP(self-adaptive trajectory prediction model based on HMM),对大数据环境下移动对象海量轨迹利用基于密度的聚类方法进行位置密度分区和高效分段处理,减少HMM的状态数量.根据输入轨迹自动选取参数组合,避免HMM模型中隐状态不连续、状态停留等问题.实验结果表明,SATP模型在实验中表现出较高的预测准确性,并维持较低的时间开销.针对速度随机改变的移动对象,其平均预测准确率为84.1%;相同情况下,平均高出朴素预测算法46.7%. 乔少杰 李天瑞 韩楠 高云君 元昌安 王晓腾 唐常杰关键词:智能交通 轨迹预测 隐马尔可夫模型 自适应 一种路网下地理社交关键字反最近邻查询处理方法 本发明公开了一种路网下地理社交关键字反最近邻查询处理方法,利用GIM树对空间路网,文本,社交数据进行存储,并利用分支界限方法遍历索引;在遍历索引时本发明首先计算索引节点的最小相似性计数表与最大相似性计数表,而后利用上述最... 高云君 赵靖文 陈刚基于度量k最近对的景点和酒店最佳配对方法 本发明公开了基于度量k最近对的景点和酒店最佳配对方法。本发明采用M树对旅游区数据集和酒店数据集分别进行索引,利用估计的第k个最近对距离和k最近对距离上界积极地修剪查询空间,以获得初步的查询结果,然后对其进行补全,从而获得... 高云君 陈璐 邢郅豪 柳晴文献传递 分布式的增量式张量Tucker分解方法 被引量:4 2021年 随着社交网络、电商系统、移动终端设备的快速发展,海量且高维的数据正以前所未有的速度不断地增长和积累.高维数据可以自然地表示为张量.张量的Tucker分解方法是一种常用且经典的高维数据分析机器学习方法,被广泛地应用于推荐系统、图像压缩、计算机视觉等多个领域.然而,传统的张量分解方法大多只能处理静态的数据,并不适用于动态增长的数据.当处理不断增长的数据时,传统方法大多只能低效地重新开始计算,以完成张量分解.针对增量式数据对传统张量分解方法带来的挑战,本文提出了一种分布式的增量式张量Tucker分解方法DITTD,首次解决了海量高维且动态增长数据上高效的分布式张量Tucker分解问题.该方法首先根据增量数据相对原始数据的位置关系对其进行分类处理.为了实现分布式节点的负载均衡,本文指出张量的最优划分是NP-难问题,并使用启发式方法以实现尽可能均匀的张量划分.为了避免张量Tucker分解的中间结果爆炸问题,本文提出了一种新颖的增量式张量Tucker分解计算方法.该方法减少了中间结果的计算和网络传输通信量,以提升分布式的增量式张量Tucker分解效率.最后,本文在真实与合成数据集上进行了大量的实验.实验结果验证了本文方法的运行效率比基准方法提升了至少1个数量级,并具有良好的可扩展性. 杨克宇 高云君 陈璐 葛丛丛 沈怡峰关键词:分布式 增量式 SPARK 机器学习模型的分布式训练方法及装置、电子设备、介质 本发明公开了一种机器学习模型的分布式训练方法及装置、电子设备、介质,该方法采用梯度键值对表示所述梯度向量中的非零元素;保留绝对值大于设定阈值的所述梯度值;通过倒数映射的方式,将保留的梯度值转化为梯度倒数值;将所述梯度倒数... 高云君 杨克宇 陈璐 曾志豪文献传递