您的位置: 专家智库 > >

张安珍

作品数:3 被引量:22H指数:2
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇一致性
  • 1篇生成树
  • 1篇生成树算法
  • 1篇树算法
  • 1篇数据可用性
  • 1篇数据修复
  • 1篇数据一致
  • 1篇数据一致性
  • 1篇数据质量
  • 1篇贪心
  • 1篇贪心算法
  • 1篇条件函数依赖
  • 1篇最小生成树
  • 1篇最小生成树算...
  • 1篇可用性
  • 1篇函数依赖
  • 1篇REDUCE
  • 1篇HADOOP
  • 1篇不完整数据
  • 1篇MAP

机构

  • 3篇哈尔滨工业大...
  • 1篇沈阳航空航天...

作者

  • 3篇李建中
  • 3篇张安珍
  • 2篇高宏
  • 1篇王宏志

传媒

  • 1篇软件学报
  • 1篇计算机科学与...
  • 1篇智能计算机与...

年份

  • 1篇2020
  • 1篇2019
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
不确定图最小生成树算法被引量:2
2019年
很多领域产生的大量数据都可以很自然地用不确定图模型表示和描述,如蛋白质交互网络、社交网络、无线传感器网络等。本文研究不确定图上最可靠的最小生成树问题,该问题具有广泛的应用价值和研究意义。精确地求解算法需要枚举所有可能的最小生成树并找出其中出现次数最多的那个。因此,枚举开销随着边数增多呈指数增长,当图规模较大时并不可行。为此本文提出了一个时间复杂度为O(d|V|~2)的启发式贪心算法,其中d为最大的顶点度数,|V|为顶点数。实验结果表明,该算法具有较好的效率和较高扩展性。
张安珍李建中
关键词:贪心算法
基于符号语义的不完整数据聚集查询处理算法被引量:7
2020年
研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义中扩展了传统关系数据库模型,提出了一种通用不完整数据库模型.该模型可以处理可填充的和不可填充的两种类型缺失值.在该模型下,提出一种新的不完整数据聚集查询结果语义:可靠结果.可靠结果是真实查询结果的区间估计,可以保证真实查询结果有很大概率在该估计区间范围内.给出了线性时间求解SUM、COUNT和AVG查询可靠结果的方法.真实数据集和合成数据集上的扩展实验验证了所提方法的有效性.
张安珍李建中李建中
关键词:不完整数据数据修复数据可用性
大数据上基于Hadoop的不一致数据检测与修复算法被引量:13
2015年
随着现代社会互联网的普及应用,产生的海量数据普遍存在质量问题。针对数据质量中不一致性问题进行研究,设计并实现了基于Hadoop并行平台的不一致数据检测与修复算法。采用数据依赖理论中的条件函数依赖,根据给定规则检测不一致数据集,对这些不一致数据求解修复方案,使得修复结果满足数据一致性要求,并给出修复结果的确定性概率。最后通过实验证明了该算法较已有的单机算法有更好的修复效果,当约束规则较少的情况下,算法执行时间呈线性增长。
张安珍门雪莹王宏志李建中高宏
关键词:数据一致性MAPREDUCE条件函数依赖数据质量
共1页<1>
聚类工具0