叶晨
- 作品数:6 被引量:22H指数:2
- 供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于众包的电子商务数据实体分类系统被引量:5
- 2013年
- 电子商务发展迅速,商品数据不断增大,用户在搜索商品时总是需要浏览许多自己不需要的商品.因此找出其中描述相同的商品,对电子商务信息进行分类,能够有效提高用户的购买效率.由于各大电子商务网站人工输入的商品信息存在信息错误以及主观因素造成描述差异,现有的实体识别算法很难在电子商务数据上得到理想的结果,为商品数据的分类造成极大的困难.基于此,设计了一个基于众包的电子商务数据实体分类系统,结合Amazon Mechanical Turk(AMT)这个新兴的众包平台,实现机器实体识别算法与人工标注相结合的实体分类平台,在提高了数据分类的准确性的同时尽可能的降低实现商品数据分类的成本.
- 叶晨王宏志周小田李建中高宏
- 关键词:众包AMAZONMECHANICALTURK
- 一种海量存储系统二级缓存的设计与实现被引量:1
- 2013年
- 引入新颖固态存储技术和DRAM与固态硬盘(SSD)混合的缓存架构,提出一种海量存储系统的二级缓存策略,通过回写策略能够有效减少SSD缓存的小写问题,并对两级缓存架构下建立的逻辑磁盘进行测试,结果表明在请求平均响应时间上取得了优化。
- 叶晨张延园
- 关键词:海量存储固态硬盘二级缓存
- 面向众包数据清洗的主动学习技术被引量:16
- 2020年
- 传统方法多数采用机器学习算法对数据进行清洗.这些方法虽然能够解决部分问题,但存在计算难度大、缺乏充足的知识等局限性.近年来,随着众包平台的兴起,越来越多的研究将众包引入数据清洗过程,通过众包来提供机器学习所需要的知识.由于众包的有偿性,研究如何将机器学习算法与众包有效且低成本结合在一起是必要的.提出了两种支持基于众包的数据清洗的主动学习模型,通过主动学习技术来减少众包开销,实现了对给定的数据集基于真实众包平台的数据清洗,最大程度减少成本的同时提高了数据的质量.在真实数据集上的实验结果验证了所提模型的有效性.
- 叶晨王宏志高宏李建中
- 关键词:众包数据清洗
- 基于ETW的Windows系统性能监测技术
- 2014年
- 系统性能的监测与分析是发现系统运行过程中的瓶颈、优化系统性能的有效手段。传统的监测工具缺乏完善的监控系统,数据表达的细度和深度不够,对系统本身性能有较大影响。本文设计并实现一种基于ETW机制的可视化监视系统Perfornitor,该系统可以较好地解决上述问题;利用Perfornitor对两个具体性能监测的实例进行分析,结果表明该技术能够为系统分析员快速发现并解决系统性能问题提供有效的帮助。
- 李梦家李战怀李宁叶晨
- 关键词:性能监测性能分析可视化
- 基于众包的电子商务数据实体分类系统
- 商务发展迅速,商品数据不断增大,用户在搜索商品时总是需要浏览许多自己不需要的商品.因此找出其中描述相同的商品,对电子商务信息进行分类,能够有效提高用户的购买效率.由于各大电子商务网站人工输入的商品信息存在信息错误以及主观...
- 叶晨王宏志周小田李建中高宏
- 关键词:信息处理优化设计
- 关于数据密集型的众包清洗平台
- 网在产生大量数据的同时,也产生了很多的错误,数据清洗因而成为重要而迫切的任务.当前的数据清洗技术存在清洗算法不合理和清洗效率低2方面不足.众包是一种拥有广泛用户基础的完成任务的新模式,具有高效廉价的特点,可以弥补当前清洗...
- 李可利王宏志叶晨郭欣彤李建中高宏