搜索到1321篇“ TOP-K“的相关文章
Top-k空间偏好查询方法研究
2024年
随着无线通信技术的发展和智能移动终端的广泛普及,基于位置的服务已经融入了人们生活的方方面面。其中,Top-k空间偏好查询在地理信息系统、城市建设规划、资源调度与分配、旅游规划等领域具有重要的意义。Top-k空间偏好查询是根据空间对象周围的特征对空间对象进行等级评价,并返回具有最高等级评价的k个空间对象。目前,对于Top-k空间偏好查询的研究主要集中在欧式空间和路网环境,本文对欧式空间和路网环境下的Top-k空间偏好查询方法进行分析和比较。
田春鲍金玲张志威刘刚
关键词:欧式空间路网环境
大图中多样化Top-k模式挖掘算法研究
2024年
频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据挖掘领域的一项重要任务。该任务的目标是从图数据中找到出现频次大于给定阈值的所有模式。近年来,随着社交网络等大规模图数据的涌现,单一大图上的FPM问题受到广泛关注,并得到了较为充分的研究,取得了一系列研究成果。然而,已有技术大都存在着计算成本高、挖掘结果理解困难以及并行计算难等问题。针对上述问题,文中提出了一种从大规模图数据中挖掘多样化top-k模式的方法。首先设计了一个多样化函数,用于度量模式集合的多样性;随后设计了一种面向分布式图数据,具有提前终止特性的分布式挖掘算法DisTopk,以实现多样化top-k模式高效挖掘。在真实图数据和合成图数据上进行了大量实验,结果表明,与传统分布式挖掘算法相比,DisTopk算法能更高效地挖掘多样化top-k模式。
何宇昂王欣沈玲珍
关键词:频繁模式挖掘分布式挖掘
基于学习的高效Top-k代表性相似子轨迹查询
轨迹数据记录了空间中移动的实体(例如人、车辆、动物等)位置信息随时间的变化情况,已成为现代信息系统中不可或缺的部分。它们广泛应用于交通流预测、旅行时间估计、动态路径规划等领域,为城市规划、物流管理和个人导航提供有力支持。...
王坤明
关键词:相似查询TOP-K查询
一次性条件下top-k高平均效用序列模式挖掘算法
2024年
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。
杨克帅武优西耿萌刘靖宇李艳
关键词:数据挖掘序列模式挖掘TOP-K
分布式网络中连续时间周期的全局top-K频繁流测量
2024年
在分布式网络中,测量top-K频繁流对资源分配、安全监控等应用至关重要。现有的top-K频繁流测量工作存在不适用于测量分布式网络流量或只考虑单时间周期等局限。为此,提出了分布式网络中连续时间周期的全局top-K频繁流测量方案,在分布节点中布置了紧凑的概率数据结构来记录网络流信息,每个时间周期结束后分布节点向中心节点发送必要信息,中心节点汇聚得到从测量开始至当前时间周期的全局top-K频繁流。考虑到每条流可能出现在一个或多个测量节点,使用了不同的方法来减少传输开销。对于每条流只会出现在单一节点的情况,采用传输分段最小值的方法来获得阈值,实验结果表明这种方法减少了全量传输超过50%的传输开销。对于每条流会出现在多个节点的情况,提出了多阶段无误差处理方法和单阶段快速处理方法,分别应对不能容忍误差的场景和实际高速网络流量,相比每个时间周期都使用已有单周期方法,传输开销的实验表现降低了两个数量级。最后还提出了一种利用历史平均增值信息降低通信延迟的方法,实验结果表明该方法有效降低了限制信息的平均相对误差。
毛晨宇黄河孙玉娥杜扬
关键词:分布式网络SKETCH
PeakSketch:检测网络流中的top-k流的无偏和通用草图
2024年
通过对现有Sketch结构的研究,提出一种新的Sketch结构:PeakSketch,本文将其应用于三种任务:检测top-k频繁流,检测top-k重变化流,检测top-k持久流,从理论上证明了PeakSketch可以提供无偏估计,并且给出了算法的误差界。实验结果表明,PeakSketch的各项性能优秀,在检测top-k频繁流任务中,PeakSketch的吞吐量显著提升,特别是在分配内存小于200 kB以下时,吞吐量最高提升可以达到50%,准确率最高提升一倍,PeakSketch也展现突出的性能。
李旭王超尹慰民周萍
关键词:SKETCH无偏估计
基于本地差分隐私的网络测量Top-k目的地址估计研究
2024年
针对网络测量中的Top-k目的地址问题,设计了基于布谷鸟过滤器的ε-本地差分隐私Top-k目的地址估计机制。在保护隐私的前提下,该机制能够提高对Top-k目的地址的估计效果。采用了多轮迭代方法,将布谷鸟过滤器和本地差分隐私模型结合,在服务器端和客户端进行了一轮交互。理论分析部分证明了所提出的机制符合本地差分隐私模型,并在数据集上进行了实验,对比了F1分数、NCR分数以及L1误差,验证了所提机制的有效性。
宋绮梦
关键词:网络测量隐私保护
空间关键字top-k查询的why问题
2024年
为提高空间关键字top-k查询的why问题处理效率,设计了一种名为WIR-tree的索引结构,以在访问非叶子结点下的子树之前,先估算其索引的所有对象与查询之间的空间距离和文本相似性的上限值,进而进行剪枝操作.此外,基于所构建的WIR-tree,提出了一种WSKQK算法,通过编辑距离递增方式枚举关键字集,并结合查询处理提早结束策略,加速空间关键字top-k查询why问题的整个处理过程.最后,通过与现有的基于setR-tree索引的BS算法进行对比实验,验证了所提方法的高效性和可扩展性.
黄金亮李艳红卢航
关键词:查询
支持关键词搜索的top-K条最优路线查询问题
2024年
支持关键词搜索的top-K条最优路线查询问题是针对给定的道路网络、兴趣点集合、起点和多个关键词的路线查询。查询旨在找到途经与查询关键词匹配的多个兴趣点的k条最优路线。然而,一些现有研究为降低算法的复杂度,将用户输入关键词的顺序作为到达兴趣点顺序,不适用于对兴趣点到达顺序没有要求的场景,降低了实用性;另一些研究为提高查询效率,设定距离阈值对不符合要求的兴趣点剪枝,然而这类算法无法保证被剪枝的兴趣点一定不能组成最优路线。针对上述问题,提出一种关键词感知的top-K最优路线搜索(KKRS)算法。首先,将整个道路网络划分为多个子网络。然后,采用启发式搜索策略从查询起点所在的子网络开始逐步扩展搜索范围,直至找到top-K条最优路线或遍历完整个道路网络。在扩展过程中,引入子图剪枝策略,用于剪去不包含top-K最优路线的子网络,缩小搜索范围。此外,为避免对每个可能构成最优路线的兴趣点集合依次计算,设计兴趣点序列的剪枝策略,以快速过滤不可能构成最优路线的兴趣点序列,降低计算代价。最后,在真实数据集和合成数据集上对提出的两种剪枝算法进行实验,实验结果表明这两种算法在所有数据集上的子图剪枝上都能达到70%以上的剪枝率,在兴趣点序列剪枝上则能保证60%以上的剪枝率。与目前已有的先进算法大规模路网图下关键词覆盖最优路径查询(KORL)、ROSE-GM(Recurrent Optimal Subroute Expansion Using Greedy Merge Strategy)、OSSCaling和StarKOSR(finding Top-K Optional Sequenced Routes with A*)相比,KKRS算法比对比算法中查询效率较高的StarKOSR算法提高了40%。
赵浩宇于自强陈晓萌陈国祥朱慧李博涵
关键词:道路网络关键词搜索
一种Top-K大象流的检测方法
本发明公开了一种Top‑K大象流的检测方法,所述Top‑K大象流的检测方法包括:S1:获取网络流数据;S2:对所述网络流数据进行解析,得到解析后的网络流数据;S3:利用NewKeeper检测所述解析后的网络流数据中的To...
杨宋亮马强谭顺华廖梓钧李波赵兴达

相关作者

李建中
作品数:507被引量:4,173H指数:27
供职机构:哈尔滨工业大学
研究主题:无线传感器网络 数据库 查询处理 XML 传感器网络
孟祥福
作品数:131被引量:401H指数:10
供职机构:辽宁工程技术大学电子与信息工程学院
研究主题:兴趣点 关键字 TOP-K 用户偏好 关键字查询
王国仁
作品数:351被引量:1,769H指数:22
供职机构:东北大学
研究主题:XML 面向对象 数据库 聚类 查询处理
高宏
作品数:226被引量:1,566H指数:18
供职机构:哈尔滨工业大学
研究主题:查询处理 大数据 无线传感器网络 数据库 数据质量
于戈
作品数:621被引量:4,280H指数:31
供职机构:教育部
研究主题:无线传感器网络 数据库 数据流 XML 数据挖掘