叶鸥
作品数: 4被引量:44H指数:2
  • 所属机构:西安理工大学计算机科学与工程学院
  • 所在地区:陕西省 西安市
  • 研究方向:自动化与计算机技术
  • 发文基金:国家高技术研究发展计划

相关作者

张璟
作品数:148被引量:739H指数:14
供职机构:西安理工大学计算机科学与工程学院
研究主题:WEB服务 虚拟机 WEB 虚拟化 XML
李军怀
作品数:262被引量:1,407H指数:18
供职机构:西安理工大学
研究主题:XML WEB RFID 数据挖掘 基于XML
中文地名数据清洗技术及其工程应用研究
随着科学技术进步与信息技术发展,各行各业中不同类型的信息系统(例如协同设计与制造系统、客户关系管理系统、企业资源规划系统、供水工程信息系统等)应用日益广泛。在这些信息系统的应用过程中,积累了大量来源不同、类型各异的数据,...
叶鸥
关键词:数据清洗技术重复记录检测孤立点检测
文献传递
中文地名数据清洗中的重复字段匹配被引量:3
2013年
为了提高中文地名字段匹配的准确度,提出中文地名的相似重复检测与清洗策略和矩阵相似重复匹配方法.该清洗策略采用矩阵相似重复匹配方法,通过矩阵运算计算中文地名数据之间相同字符或者词语出现的频率,利用频率计算两者之间的语义相似度和结构相似度,然后将语义和结构相似性有机结合,作为相似性判断和重复数据清洗的依据.实验验证了该方法的可行性和有效性.结果表明,该方法对于中文地名字段匹配在查准率和召回率方面优于已有的其他算法.
叶鸥张璟李军怀
关键词:数据清洗中文地名语义相似度结构相似度
XML与模式匹配技术及其应用研究
为了贯彻中央“让群众喝上放心水”的重要精神,促进农村供水现代化管理水平与效率的提高,提供实用供水信息化管理工具,作者受委托参与本课题,进行了某省农村饮水工程信息管理系统/(RDWIS/)的研究开发工作。 在深...
叶鸥
关键词:XMLWEBGIS瘦客户端空间数据农村饮水
文献传递
中文数据清洗研究综述被引量:43
2012年
针对中文数据清洗研究进行了综述。阐明了全面数据质量管理与数据清洗之间的关系,给出数据清洗的定义及对象;介绍中文数据清洗问题产生的背景、国内外研究现状与研究热点,并简介其基本原理、模型及已有算法;着重阐明了中文数据清洗的方法;总结中文数据清洗研究的不足,并对中文数据清洗的研究及应用进行了展望。
叶鸥张璟李军怀
关键词:数据质量管理数据集成