您的位置: 专家智库 > >

曾伟辉

作品数:11 被引量:116H指数:7
供职机构:中国科学院合肥智能机械研究所更多>>
发文基金:国家自然科学基金中国科学院知识创新工程重要方向项目模式识别国家重点实验室开放课题基金更多>>
相关领域:自动化与计算机技术农业科学电子电信更多>>

文献类型

  • 9篇期刊文章
  • 2篇学位论文

领域

  • 10篇自动化与计算...
  • 1篇电子电信
  • 1篇农业科学

主题

  • 6篇网络
  • 3篇神经网
  • 3篇神经网络
  • 3篇农作
  • 3篇农作物
  • 3篇爬虫
  • 3篇作物
  • 3篇网络爬虫
  • 3篇鲁棒
  • 3篇鲁棒性
  • 3篇卷积
  • 3篇卷积神经网络
  • 3篇病害
  • 2篇语料
  • 2篇农作物病害
  • 2篇作物病害
  • 2篇病害识别
  • 1篇动词
  • 1篇动词短语
  • 1篇动态网

机构

  • 9篇中国科学院
  • 8篇中国科学技术...

作者

  • 11篇曾伟辉
  • 9篇李淼
  • 5篇张健
  • 2篇陈雷
  • 1篇曾新华
  • 1篇朱泽德
  • 1篇熊焰

传媒

  • 2篇中国科学技术...
  • 2篇计算机系统应...
  • 1篇电子学报
  • 1篇中文信息学报
  • 1篇中南大学学报...
  • 1篇计算机科学与...
  • 1篇中国科学数据...

年份

  • 1篇2020
  • 3篇2019
  • 1篇2018
  • 1篇2015
  • 2篇2013
  • 2篇2009
  • 1篇2008
11 条 记 录,以下是 1-10
排序方式:
汉维可比语料数据集被引量:1
2020年
语料库的构建是自然语言处理领域的重要工作。但是,双语平行语料库的规模和领域并不能满足实际的需求,尤其是在维吾尔语信息处理中表现得更加明显。因此,从互联网上挖掘汉维双语资源的工作,对于汉维双语资源的建设、促进民族之间的交流具有十分重要的作用。本文针对维吾尔语复杂多变以及汉维语言形态差异大等特点,研究并设计了汉维可比语料挖掘系统。本系统主要包括汉维网页正文抽取,汉维可比语料候选获取以及跨语言相似度计算等几个部分。目前已经有5000个汉维可比语料篇章,主要是新闻领域语料和政府公文等。该语料库对于少数民族语言分析与教学,汉维机器翻译等领域具有十分重要的作用。为了使用的便利,本数据集对汉语和维吾尔语进行了进一步的加工和规范化操作。
冯韬李淼曹宜超曾伟辉
关键词:语料库建设数据挖掘
结合局部歧义词网格与条件随机场的双层分词法被引量:2
2013年
本文提出了一种结合局部歧义词网格与条件随机场的双层中文分词模型。首先在底层使用局部歧义词网格对文本进行粗切分,并将切分结果作为一项特征提供给高层的条件随机场模型;然后使用条件随机场模型对文本进行标注分词。局部歧义词网格方法能够检测分词过程中产生的歧义问题,条件随机场模型能够平衡对待词表词和未登录词。两种方法的结合能够较好地解决分词中的分词歧义和未登录词问题。本文在国际ee文分词评测活动Bakeoff2005提供的PKU和MSRA语料上对该双层分词模型进行了系统封闭测试,并进行了四字位标注集与六字位标注集的对比。实验结果的最佳F值分别达到了95.1%和97.1%,优于单独使用条件随机场的分词效果。此外,开放测试的实验结果表明该模型也具有一定的实际意义。
陈雷李淼张健曾伟辉
关键词:条件随机场分词
一种基于LDA模型的关键词抽取方法被引量:15
2015年
为解决现有方法未能综合考察文档主题的全面性、关键词的可读性以及差异性,提出一种基于文档隐含主题的关键词抽取新算法TFITF。算法根据大规模语料产生隐含主题模型计算词汇对主题的TFITF权重并进一步产生词汇对文档的权重,利用共现信息排序和选择相邻词汇形成候选关键短语,再使用相似性排除隐含主题一致的冗余短语。此外,从文档统计信息、词汇链和主题分析3方面来进行关键词抽取的对比测试,实验在1 040篇中文摘要及5 408个关键词构成的测试集上展开。结果表明,算法有效地提高文档关键词抽取的准确率与召回率。
朱泽德李淼张健曾伟辉曾新华
关键词:信息抽取关键词抽取LDA模型
深层网络爬虫研究综述被引量:41
2008年
随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
曾伟辉李淼
关键词:深层网络网络爬虫信息检索URL动态网页
支持AJAX的网络爬虫系统设计与实现
2005年J.J.Garrett提出了建立在JavaScript+XML基础上的AJAX的定义与概念。该技术的特点是:用户操作与服务器响应异步化,达到了节约服务器空间,提高网络交互效率的目的。因而被各大网站相继采用。但由...
曾伟辉
关键词:AJAX网络爬虫异步交互
文献传递
面向农作物病害识别的高阶残差卷积神经网络研究被引量:7
2019年
当前研究农作物病害的准确识别工作中,针对简单背景的农作物病害图像识别取得了巨大成功,但当面向包含有各种噪声和复杂背景真实场景的农作物病害图像识别问题时,难以满足识别准确率的要求.为此提出了一种新的面向农作物病害识别应用的高阶残差卷积神经网络方法,以实现农作物病害的准确、抗干扰的识别.实验结果表明,该方法具有高准确率、强鲁棒性和良好的抗干扰能力,能较好地满足农作物病害识别的实际应用需求.
曾伟辉李淼李淼张健王敬贤袁媛
关键词:鲁棒性卷积神经网络
基于室内定位技术的人体姿态识别方法被引量:2
2019年
独居老人摔倒等姿态检测是当今备受关注的问题.基于机器视觉的方法存在隐私侵入,成本高和实现过程复杂等问题,而基于加速度传感的方法对静止姿态识别存在困难.为此提出一种基于室内定位技术的老人姿态检测方案.首先在人体关键节点安装可穿戴接收标签,然后采用超宽带UWB测距方法,实现人体关键部位的定位和跟踪.在姿态估计算法中,分别采用最小二乘和改进的扩展卡尔曼滤波算法来抑制噪声,提高定位精度.仿真实验表明,改进的扩展卡尔曼滤波算法误差较小,可以较好地识别老人摔倒等姿态信息.
黄小平张健胡泽林李淼曾伟辉李华龙
关键词:卡尔曼滤波
面向农作物叶片病害鲁棒性识别的深度卷积神经网络研究
农作物病害识别对于农作物病害的准确诊断和科学防治具有极其重要的作用,也是农产品产量和品质的重要保障。我国是农业大国,民以食为天。农业是人类的衣食之源、生存之本,是国民经济建设和发展的基石。农作物安全生产是提高农业经济效率...
曾伟辉
关键词:农作物病害图像识别鲁棒性
基于高阶残差和参数共享反馈卷积神经网络的农作物病害识别被引量:20
2019年
当前,大部分农作物病害图像识别方法主要关注于精度而忽略了鲁棒性.在面向实际环境时,由于噪声干扰和环境因素影响导致识别精度不高.为此提出了一种高阶残差和参数共享反馈的卷积神经网络模型以应用于实际环境农作物病害识别.其中,高阶残差子网络为病害表观提供丰富细致的特征表达,以提高模型识别精度;参数共享反馈子网络用来进一步抑制原深层特征中的背景噪声,以提高模型的鲁棒性.实验结果表明,当面向实际环境农作物病害识别时,本文方法在识别精度和鲁棒性上均优于其他方法.
曾伟辉李淼李增熊焰
关键词:鲁棒性
有限语料汉蒙统计机器翻译调序方法研究被引量:2
2013年
自统计机器翻译技术出现以来,调序一直是语序差异显著的语言对互译系统中的关键问题,基于大规模语料训练的调序方法得到了广泛研究。目前汉蒙双语语料资源十分有限,使得现有的依赖于大规模语料和语言学知识的调序方法难以取得良好效果。该文对已有的相关研究进行了分析,提出了在有限语料条件下的汉蒙统计机器翻译调序方法。该方法依据语言学知识获取对译文语序影响显著的短语类型,研究这些短语类型的调序方案,并融入已有的调序模型实现调序的优化。实验表明该方法在有限语料条件下的效果提升显著。
陈雷李淼张健曾伟辉
关键词:统计机器翻译动词短语
共2页<12>
聚类工具0