您的位置: 专家智库 > >

马茜

作品数:6 被引量:34H指数:3
供职机构:东北大学计算机科学与工程学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 2篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 2篇多模态
  • 2篇异构
  • 2篇阅读器
  • 2篇冗余
  • 2篇数据清洗
  • 2篇数据冗余
  • 2篇数据质量
  • 2篇感知
  • 2篇RFID
  • 1篇多维度
  • 1篇质量管理
  • 1篇数据获取
  • 1篇数据流
  • 1篇数据源
  • 1篇缺失数据
  • 1篇网络
  • 1篇维度
  • 1篇感知网络

机构

  • 6篇东北大学

作者

  • 6篇于戈
  • 6篇谷峪
  • 6篇马茜
  • 4篇张天成
  • 2篇李芳芳
  • 1篇李天义

传媒

  • 2篇软件学报
  • 1篇计算机学报
  • 1篇小型微型计算...
  • 1篇2012中国...
  • 1篇2013中国...

年份

  • 2篇2016
  • 2篇2013
  • 2篇2012
6 条 记 录,以下是 1-6
排序方式:
一种基于数据质量的异构多源多模态感知数据获取方法
近年来,物联网由于其广阔的应用前景得到快速发展,感知设备的种类也越来越丰富.并且很多应用中均通过部署多个相互独立的异构数据源对监测对象的多维属性进行度量,由此得到异构多源多模态感知数据.但由于硬件设备固有的限制以及环境噪...
马茜谷峪张天成于戈
关键词:质量管理
文献传递
一种基于数据质量的异构多源多模态感知数据获取方法被引量:21
2013年
近年来,物联网由于其广阔的应用前景得到快速发展,感知设备的种类也越来越丰富.并且很多应用中均通过部署多个相互独立的异构数据源对监测对象的多维属性进行度量,由此得到异构多源多模态感知数据.但由于硬件设备固有的限制以及环境噪声等因素的影响,感知设备不可避免地存在漏读、多读、错读等现象,导致感知数据的数据质量降低.而数据是信息的载体,其能否准确反映物理世界的真实信息是决定其在上层应用中发挥效用的关键.基于此,该文提出一种基于数据质量的异构多源多模态感知数据获取方法.首先定义了数据质量的3个方面:准确性、完整性和一致性;进而对数据质量在这3个方面进行建模,提出评价异构多源多模态感知数据综合数据质量的方法;最后提出基于数据质量的感知数据获取算法,根据用户给定的任意精度,选择部分数据源用于数据传输,在保证数据质量的前提下尽可能地减少网络资源的消耗,并通过大量实验验证了算法的高效性和可用性.
马茜谷峪张天成于戈
关键词:多模态数据质量数据获取
顺序敏感的多源感知数据填补技术被引量:5
2016年
近年来,随着感知网络的广泛应用,感知数据呈爆炸式增长.但是由于受到硬件设备的固有限制、部署环境的随机性以及数据处理过程中的人为失误等多方面因素的影响,感知数据中通常包含大量的缺失值.而大多数现有的上层应用分析工具无法处理包含缺失值的数据集,因此对缺失数据进行填补是不可或缺的.目前也有很多缺失数据填补算法,但在缺失数据较为密集的情况下,已有算法的填补准确性很难保证,同时未考虑填补顺序对填补精度的影响.基于此,提出了一种面向多源感知数据且顺序敏感的缺失值填补框架OMSMVI(order-sensitive missing value imputation framework for multi-source sensory data).该框架充分利用感知数据特有的多维度相关性:时间相关性、空间相关性、属性相关性,对不同数据源间的相似度进行衡量;进而,基于多维度相似性构建以缺失数据源为中心的相似图,并将已填补的缺失值作为观测值用于后续填补过程中.同时考虑缺失数据源的整体分布,提出对缺失值进行顺序敏感的填补,即:首先对缺失值的填补顺序进行决策,再对缺失值进行填补.对缺失值进行顺序填补能够有效缓解在缺失数据较为密集的情况下,由于缺失数据源的完整近邻与其相似度较低引起的填补精度下降问题;最后,对KNN填补算法进行改进,提出一种新的基于近邻节点的缺失值填补算法NI(neighborhood-based imputation),该算法利用感知数据的多维度相似性对缺失数据源的所有近邻节点进行查找,解决了KNN填补算法K值难以确定的问题,也进一步提高了填补准确性.利用两个真实数据集,并与基本填补算法进行对比,验证了算法的准确性及有效性.
马茜谷峪李芳芳于戈
关键词:缺失数据感知网络
一种基于多阅读器数据冗余的高效RFID数据清洗策略被引量:3
2012年
随着RFID技术的发展,RFID的应用越来越广泛.然而,由于RFID硬件设备固有的限制和环境噪声的影响,造成了RFID原始数据的不确定性,使RFID在很多领域中的应用受到限制.现实应用中的部署环境通常由多个阅读器及大量标签组成,而现有的数据清洗算法大多只针对单个阅读器对标签的读取情况进行研究,因此在真实应用中的效果差强人意.本文综合考虑RFID的数据特性、阅读器和部署环境的先验知识以及具体应用中的约束条件三个方面,提出一种更贴近现实应用的基于多阅读器数据冗余的数据清洗策略LC-INFER(Location-Containment Inference):首先基于贝叶斯推理对数据进行初步清洗,其次结合基于物体间包含关系的平滑技术,并考虑约束条件对数据进行二次清洗以提高数据的准确性,最后部署真实供应链应用环境进行实际测试,并用大量仿真数据集进行模拟测试,验证了本文提出的RFID数据清洗算法的准确性及高效性.
马茜谷峪张天成于戈
关键词:数据清洗数据冗余
一种多源感知数据流上的连续真值发现技术被引量:5
2016年
真值发现作为整合由不同数据源提供的冲突信息的一种手段,在传统数据库领域已经得到了广泛的研究.然而现有的很多真值发现方法不适用于数据流应用,主要原因是它们都包含迭代的过程.针对一种特殊的数据流——感知数据流上的连续真值发现问题进行了研究.结合感知数据本身及其应用特点,提出一种变频评估数据源可信度的策略,减少了迭代过程的执行,提高了每一时刻多源感知数据流真值发现的效率.首先定义并研究了当感知数据流真值发现的相对误差和累积误差较小时,相邻时刻数据源的可信度变化需要满足的条件,进而给出了一种概率模型,以预测数据源的可信度满足该条件的概率.之后,通过整合上述结论,实现在预测的累积误差以一定概率不超过给定阈值的前提下,最大化数据源可信度的评估周期以提高效率,并将该问题转化为一个最优化问题.在此基础上,提出了一种变频评估数据源可信度的算法——CTF-Stream(continuous truth finding over sensor data streams),CTF-Stream结合历史数据动态地确定数据源可信度的评估时刻,在保证真值发现结果达到用户给定精度的同时提高了效率.最后,通过在真实的感知数据集合上进行实验,进一步验证了算法在处理感知数据流的真值发现问题时的效率和准确率.
李天义谷峪马茜李芳芳于戈
关键词:数据流
一种基于多阅读器数据冗余的高效RFID数据清洗策略
随着RFID技术的发展,RFID的应用越来越广泛。然而,由于RFID硬件设备固有的限制和环境噪声的影响,造成了RFID原始数据的不确定性,使RFID在很多领域中的应用受到限制。现实应用中的部署环境通常由多个阅读器及大量标...
马茜谷峪张天成于戈
关键词:数据清洗数据冗余
文献传递
共1页<1>
聚类工具0