您的位置: 专家智库 > >

熊晶

作品数:4 被引量:20H指数:2
供职机构:南京邮电大学计算机学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇删除
  • 2篇数据删除
  • 2篇重复数据
  • 2篇重复数据删除
  • 2篇重复数据删除...
  • 1篇阳性
  • 1篇阴性
  • 1篇隐私
  • 1篇隐私保护
  • 1篇隐私保护算法
  • 1篇社会网
  • 1篇社会网络
  • 1篇加权
  • 1篇假阳性
  • 1篇假阴性
  • 1篇个性化
  • 1篇汉明距离
  • 1篇保护算法
  • 1篇SIM
  • 1篇BLOOM_...

机构

  • 4篇南京邮电大学

作者

  • 4篇陈琳
  • 4篇陈春玲
  • 4篇熊晶
  • 3篇余瀚

传媒

  • 2篇计算机技术与...
  • 2篇南京邮电大学...

年份

  • 4篇2016
4 条 记 录,以下是 1-4
排序方式:
基于Simhash算法的重复数据删除技术的研究与改进被引量:15
2016年
为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征值的词性与词长两大影响因素考虑其中。然后对产生的签名值进行汉明距离的比较,从而精确地判定出待比较者是否为相似数据。实验结果表明:改进的算法性能得到提高,并且总体优于Shingle算法和原Simhash算法。通过提高签名值的精度能够实现大规模文档中相似技术的精确检测,达到理想的去重效果。
陈春玲陈琳熊晶余瀚
关键词:汉明距离
基于动态社会网络数据发布的个性化隐私保护被引量:4
2016年
针对动态社会网络数据发布中用户的个性化隐私保护要求L和所属社区属性C并没有得到足够重视的问题,提出了一种基于动态社会网络数据发布的个性化隐私保护方法。将社会网络中的隐私保护级别分为3个等级:不需保护L=0、防止度攻击L=1和防止领域子图攻击L=2。对于L≠0的节点集,通过k-分组和(k,△d)方法对节点进行匿名,其中k-分组满足社区属性C的k-多样性;对L=2的节点集,进行k-领域子图匿名。理论分析和实验表明:攻击者不能以大于1/k的概率识别出某节点,且不能以大于u的概率推出两节点之间存在敏感边。该方法能够满足社会网络中各用户对隐私保护的要求,对于同一隐私保护程度降低了社会网络图的信息损失。
陈春玲熊晶陈琳
加权社会网络中的个性化隐私保护算法被引量:1
2016年
针对加权社会网络中存在一部分用户不需要隐私保护或者需要某种特殊隐私保护的现象,提出了一种基于加权社会网络数据发布的个性化隐私保护方法。将社会网络中的隐私保护分为3个等级:不需保护L=0、防止权重包攻击L=1和防止敏感属性泄漏L=2。对于L≠0的节点集,通过k-度分组和修改权重包信息对节点进行匿名,使得每个分组满足权重包k-匿名;在分组过程中,对于存在L=2的分组要求其敏感属性满足l-diversity。理论分析和实验表明:攻击者不能以大于1/k的概率识别出某节点,且不能以大于1/l的概率推断出节点的敏感信息。该方法能够满足社会网络中各用户对隐私保护的要求,同时降低了社会网络图的信息损失。
陈春玲熊晶陈琳余瀚
关键词:隐私保护个性化
Bloom Filter在重复数据删除技术中应用的研究
2016年
为了缓解存储系统中因为重复数据索引而引起的存储设备访问过于频繁的问题,深入研究重复数据删除技术,并针对目前重复数据删除技术中Bloom Filter的运用以及存在的存储设备访问性能问题进行分析和研究,提出一种基于Bloom Filter的高效去重优化模式。针对单一Bloom Filter固有的假阳性的缺陷,增加辅助Bloom Filter,从而减小误判率,达到减少存储设备访问次数的目的;针对因系统软件错误引起的Bloom Filter假阴性错误,引入单校验位的错误校验机制可以实现避免假阴性值存储的同时又能减小内存存储开销。仿真实验结果表明:改进方法能够兼顾Bloom Filter的误判率与存储设备访问开销问题。通过引入一种判断机制配合辅助Bloom Filter和单校验位机制,能够达到误判率降低、存储设备访问开销减小的高性能优化效果。
陈春玲陈琳熊晶余瀚
关键词:BLOOMFILTER假阳性假阴性
共1页<1>
聚类工具0