钱龙华
- 作品数:83 被引量:205H指数:8
- 供职机构:苏州大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 基于句法和语义特征的疾病名称识别被引量:4
- 2018年
- 生物医学实体识别(如基因/蛋白质、化学物和疾病等)是生物医学文本挖掘的基础,它对生物医学实体关系的抽取和生物医学知识库的建立等方面都有着重要的研究意义.针对目前的疾病名称识别中存在的问题,本文提出了一系列新的句法特征和语义特征来提高疾病名称识别的性能,其中句法特征包括组块和依存信息,语义特征包括疾病名称的缩写信息、字典信息和疾病概念之间的上下位关系等.在NCBI疾病语料库上的实验表明,结合一系列句法和语义特征的CRF模型可以显著提高疾病实体识别的性能,取得了目前该语料库上的最高F1值85.3%.
- 何云琪刘苏文钱龙华周国栋
- 关键词:条件随机场句法特征语义特征
- 计算机网络课程实验方案设计被引量:4
- 2012年
- 针对计算机网络具有交互性和随机性的特点,提出在设计计算机网络课程实验方案时应遵循两个原则,即采用逐步展开的方法体现交互性的特点以及采用人工模拟的方法克服随机性的问题。在此基础上,根据网络体系结构的分层原理,设计一系列实验来加强学生对网络通信原理的理解和掌握。
- 钱龙华李领治龚声蓉朱艳琴
- 关键词:计算机网络交互性随机性
- 基于Web集成的联合书目检索系统被引量:2
- 2007年
- 传统的书目检索系统一般只能检索本地或单一馆藏的图书情报资料,不能对多个馆藏资料进行联合书目检索.提出了一个基于Web集成的联合书目检索系统,它能够根据读者提供的检索关键字同时从多个图书馆的Web书目检索系统中检索出相应书目信息,并集成在统一的数据库中,再将书目数据以Web方式返回给读者.由于大多数图书馆均提供了Web书目检索系统,因此该联合书目检索系统具有通用性和可行性的特点.
- 章旭钱龙华
- 关键词:书目检索系统WEB集成逆向工程
- 基于机器翻译的跨语言关系抽取被引量:2
- 2013年
- 训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力。该文提出了使用机器翻译的方法将源语言的关系实例转换成目标语言的关系实例,并通过实体对齐策略将它们加入到目标语言的训练集中,从而使资源丰富的源语言帮助欠资源的目标语言进行语义关系抽取。在ACE2005中英文语料库上的关系抽取实验表明,无论是将中文翻译成英文,还是将英文翻译成中文,都对另一种语言的关系抽取具有帮助作用。特别是当目标语言的训练语料库规模较小时,这种帮助就尤其显著。
- 胡亚楠舒佳根钱龙华朱巧明
- 关键词:机器翻译
- 文本信息抽取方法和系统
- 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取...
- 李培峰朱巧明孔芳周国栋钱龙华
- 文献传递
- 基于单文本指代消解的人物家庭网络构建研究
- 2014年
- 人物家庭网络是社会关系网络中的一个重要组成部分,因此,如何高效准确地提取出人物的家庭网络具有重要研究意义。该文在前人工作的基础上提出一种基于单文本指代消解技术的人物家庭关系抽取方法,以此扩大人物家庭关系抽取的范围,进而提高人物家庭网络的召回性能。该文还提出了一种基于人物虚拟边的家庭网络评估指标,用于更合理地评价构建出的人物家庭网络的性能。在大规模中文语料Gigaword上的实验表明,该方法可以较为准确地抽取出人物的家庭关系,进而提高人物家庭网络的召回性能,从而为社会网络分析提供基础数据。
- 顾静航朱苏阳钱龙华朱巧明
- 关键词:社会关系网络家庭网络
- 基于合一句法和实体语义树的中文语义关系抽取被引量:19
- 2010年
- 该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。
- 虞欢欢钱龙华周国栋朱巧明
- 一个面向信息抽取的中英文平行语料库被引量:2
- 2015年
- 除了机器翻译,平行语料库对信息检索、信息抽取及知识获取等研究领域具有重要的作用,但是传统的平行语料库只是在句子级对齐,因而对跨语言自然语言处理研究的作用有限。鉴于此,以OntoNotes中英文平行语料库为基础,通过自动抽取、自动映射加人工标注相结合的方法,构建了一个面向信息抽取的高质量中英文平行语料库。该语料库不仅包含中英文实体及其相互关系,而且实现了中英文在实体和关系级别上的对齐。因此,该语料库将有助于中英文信息抽取的对比研究,揭示不同语言在语义表达上的差异,也为跨语言信息抽取的研究提供了一个有价值的平台。
- 惠浩添李云建钱龙华周国栋
- 关键词:语义关系平行语料库
- 命名实体间语义关系抽取研究
- 命名实体间语义关系抽取是信息抽取中的重要环节,也是自然语言处理领域的热点问题之一。随着Internet的快速发展和网上信息量的迅猛增长,从自由文本中抽取出有用的结构化信息具有极其重要的意义。同时,伴随着自然语言处理技术和...
- 钱龙华
- 关键词:自然语言处理语义关系抽取树核函数
- 一个中文实体链接语料库的建设被引量:7
- 2015年
- 鉴于现有中文实体链接基准语料库的缺乏,在ACE2005中文语料库和中文维基百科的基础上,通过自动构造和人工标注的方法,构建一个中文实体链接语料库及其相关的中文知识库。与传统的英文实体链接语料库不同,构造的中文实体链接语料库是基于实体而非单个实体指称(Mention)。中文实体链接语料库的构建,将为中文实体链接研究提供一个可用的基准平台。
- 舒佳根惠浩添钱龙华朱巧明
- 关键词:中文语料库