您的位置: 专家智库 > >

白梅

作品数:7 被引量:51H指数:5
供职机构:东北大学信息科学与工程学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 7篇自动化与计算...

主题

  • 5篇查询
  • 4篇数据流
  • 4篇轮廓查询
  • 3篇不确定数据
  • 3篇查询处理
  • 2篇索引
  • 2篇不确定数据流
  • 1篇倒排索引
  • 1篇点检测算法
  • 1篇支配
  • 1篇支配关系
  • 1篇数据处理
  • 1篇数据划分
  • 1篇索引模型
  • 1篇离群点
  • 1篇离群点检测
  • 1篇离群点检测算...
  • 1篇海量
  • 1篇海量数据
  • 1篇海量数据处理

机构

  • 6篇东北大学
  • 3篇国家海洋信息...
  • 1篇东北师范大学

作者

  • 7篇白梅
  • 3篇信俊昌
  • 3篇王国仁
  • 3篇王习特
  • 2篇东韩
  • 2篇寇月
  • 2篇聂铁铮
  • 2篇于戈
  • 2篇申德荣

传媒

  • 4篇计算机学报
  • 1篇计算机研究与...

年份

  • 2篇2016
  • 1篇2015
  • 4篇2011
7 条 记 录,以下是 1-7
排序方式:
MapReduce集群中最大收益问题的研究被引量:8
2015年
MapReduce是目前最为流行的用于大数据分析的并行系统之一.许多企业已经搭建了自己的MapReduce集群,为广大用户提供计算服务.用户可以向集群提交具有完成时限要求的MapReduce作业,若作业被按时完成,则企业可以获得一定的收益.针对这种应用场景,该文首次提出了MapReduce集群中的最大收益问题.为有效地解决该问题,首先提出了一种基于序列的任务调度策略(简称为SEQ策略),并证明了在处理具有完成时限约束的作业时SEQ策略存在优势.基于SEQ策略,该文提出了最大收益的调度算法(Scheduling Algorithm for Maximum Benefit,简称AMB算法),该算法可以快速地确定可接收作业,并给出有效的执行方案,以达到最大化收益的目的.另外,针对在实际应用中的某些异常情况(如节点宕机),该文也设计了有效的超时处理策略,进一步增加了算法的实用性.最后,通过大量的实验验证了该文所提出算法的有效性.
王习特申德荣于戈白梅聂铁铮寇月
关键词:大数据
BOD:一种高效的分布式离群点检测算法被引量:29
2016年
离群点检测是数据管理领域中的热点问题之一,在许多方面都有着广泛应用,如信用卡诈骗、网络入侵检测、环境监测等.目前现有的离群点检测算法大多针对集中式的处理环境.但随着数据规模的不断增长,传统的集中式算法处理效率受限,无法满足用户日益增长的需求.针对上述问题,文中提出了一种新型的分布式离群点检测算法.首先,在数据存储阶段(即预处理),提出了BDSP(Balance Driven Spatial Partitioning)数据划分算法.该算法可以有效地均衡每个计算节点的工作负载,并实现良好的过滤效果.此外,为划分所得到的每个块设计了一种全新的编码方式,可以快速地确定块与块之间的相邻关系,降低网络开销.基于BDSP算法,提出了BOD(BDSP-based Outlier Detection)分布式离群点检测算法.该算法包括2个步骤:在每个计算节点本地,利用R树索引进行批量过滤,快速地计算离群点并得到本地候选集;利用BDSP中提供的块编码确定需要相互通信的节点,使用少量的网络开销得到最终结果.最后,通过大量实验验证了文中所提出的BDSP和BOD算法的有效性.实验结果表明,相对于现有算法,文中算法可以显著地提高计算效率并大幅降低网络开销.
王习特申德荣白梅聂铁铮寇月于戈
关键词:离群点检测分布式计算数据划分大规模数据
数据流上动态轮廓查询处理技术的研究被引量:8
2016年
轮廓查询(Skyline)是一种典型的多目标优化问题.动态轮廓查询(Dynamic Skyline)是轮廓查询的一个重要变种,其目标是对于一个给定的查询点q,返回在各维度上最接近q的所有点.对比轮廓查询,动态轮廓查询根据查询点q的位置变动,可以更加灵活地返回查询结果.文中关注数据流上动态轮廓查询处理,此问题在多目标决策方面具有非常重要的应用.为有效地解决该问题,首先提出了一种组合式索引结构来管理数据流上的点,该索引结构包括两个部分:对整体数据使用分层次划分结构进行维护;对子划分内部数据采用倒排索引结构进行维护.该组合式索引结构具有更新快、过滤性能高、适合任意数据分布等优点,可以提高动态轮廓的查询处理效率.然后,基于该组合式索引结构,提出了基础的数据流上动态轮廓查询算法(Basic Dynamic Skyline Query over Data Stream,BDS2).通过维护少量的数据,BDS2可以快速地计算出数据流上的动态轮廓集合.然而BDS2在处理个别更新时,会有较大的时间延迟,为了更稳定地计算数据流上的动态轮廓,避免更新某些点时计算量急剧增加,进一步提出了改进的数据流上动态轮廓查询算法(Improved Dynamic Skyline Query over Data Stream,IDS2).最后,通过一系列的实验验证了文中所提出算法的有效性.
白梅信俊昌王国仁王习特
关键词:数据流倒排索引
不确定数据流上的概率反轮廓查询处理被引量:5
2011年
反轮廓查询在制定有效的市场决策方面具有重要的作用,随着数据流特征和不确定性的表现日益明显,不确定数据流上概率反轮廓查询已经成为一个新的研究课题.为了高效解决不确定数据流上概率反轮廓查询问题,首先,通过对实际应用需求进行分析,提出了不确定数据流上概率反轮廓查询的定义,并根据相关概念,提出了不确定数据流上概率反轮廓查询的索引模型;其次,通过对不确定数据流上概率反轮廓的性质进行深入分析,提出了一种新颖高效的基于R-tree的不确定数据流上概率反轮廓查询算法RT2RS,该算法运用了高效的剪枝策略,避免了大量的无效运算;最后,通过大量的仿真实验对RT2RS性能进行了验证.实验结果表明,RT2RS是解决不确定数据流上概率反轮廓查询的有效方法,大大减少了不确定数据流上概率反轮廓查询的运行时间,能够满足实际应用需求.
白梅信俊昌东韩王国仁
关键词:不确定性数据流R-树
数据流中反轮廓查询处理技术研究
随着经济的发展和科技手段的进步,数据的流特征表现的越来越明显。数据流上反轮廓查询作为现在市场决策的重要手段,可以广泛应用在现实生活中。然而,现存的数据流上反轮廓查询算法没有充分利用数据流上反轮廓性质,性能十分低下,不能满...
白梅
关键词:数据流不确定数据
文献传递
一种ρ-支配轮廓查询的高效处理算法被引量:5
2011年
近年来,作为重要的多目标决策手段的轮廓查询逐渐得到学术界的重视,相继提出了基于不同支配关系的多种轮廓变体查询.首先,通过对实际应用需求进行分析,提出了基于元组对应数值间比例值大小的ρ-支配关系的定义,进而提出了ρ-支配轮廓查询的概念.其次,对ρ-支配轮廓的基本性质进行了细致而深入的分析,在此基础上,提出了基于分支定界的ρ-支配轮廓查询算法(Branch and Boundρ-Dominant Skyline Algorithm,BBDS),避免了对R-树索引的多次访问,从而提高了ρ-支配轮廓查询的执行效率.最后,通过大量的仿真实验对ρ-支配轮廓查询的语义进行分析,并对BBDS算法的性能进行验证.实验结果表明,ρ-支配轮廓查询是轮廓查询语义的扩展和补充,而提出的BBDS算法则是求解ρ-支配轮廓查询的高效算法.
信俊昌白梅东韩王国仁
关键词:轮廓查询
不确定数据流上的概率反轮廓查询处理
反轮廓查询在制定有效的市场决策方面具有重要的作用,随着数据流特征和不确定性的表现日益明显,不确定数据流上概率反轮廓查询已经成为一个新的研究课题。为了高效解决不确定数据流上概率反轮廓查询问题,首先,通过对实际应用需求进行分...
白梅信俊昌东韩王国仁
关键词:海量数据处理不确定数据流索引模型
共1页<1>
聚类工具0