杜亚茹
- 作品数:6 被引量:15H指数:1
- 供职机构:中国农业大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术农业科学更多>>
- 一种针对植物领域的非分类关系识别方法
- 本发明公开了属于计算机中文信息处理领域的一种针对植物领域的非分类关系识别方法。根据对植物领域关系的分类,对分类关系和非分类关系进行定义;获取相关词条的非结构化网页内容,作为语料并进行预处理,获得预处理模块;然后再进行基于...
- 赵明杜会芳杜亚茹陈瑛张家军彭珺
- 文献传递
- 一种疾病名词自动识别方法
- 本发明提供一种疾病名词自动识别方法,所述方法包括,获取第一预设新闻材料中的语料数据;构建疾病领域本体;对所述疾病领域本体进行扩充,得到扩充后的疾病领域本体;利用所述扩充后的疾病领域本体对从第一预设新闻材料中获取的语料数据...
- 陈瑛高万林程碧霄赵明彭珺杜亚茹
- 文献传递
- 一种针对植物领域的非分类关系识别方法
- 本发明公开了属于计算机中文信息处理领域的一种针对植物领域的非分类关系识别方法。根据对植物领域关系的分类,对分类关系和非分类关系进行定义;获取相关词条的非结构化网页内容,作为语料并进行预处理,获得预处理模块;然后再进行基于...
- 赵明杜会芳杜亚茹陈瑛张家军彭珺
- 农作物病虫害非分类关系的公理抽取方法研究
- 2015年
- 本体分为轻量级本体和重量级本体,轻量级本体主要由术语、概念、分类关系构成。在轻量级本体的基础上添加非分类关系和公理构成重量级本体。前者侧重于知识结构表达而缺乏语义和逻辑推理功能,后者具有较强的语义和逻辑推理功能,更适合信息的语义处理和新知识的发现。论文按照逆反公理和对称公理的语言模式构造原有非分类关系的模式,然后利用轻量级本体对生成的模式进行扩展,同时结合使用统计学中共现值的方法,最终达到抽取农业病虫害领域的公理。抽取公理中模式的扩展利用了轻量级本体,提高了公理抽取的效果。此外,论文将公理抽取的方法应用于中文领域,抽取中文语料的逆反公理和对称公理。
- 梅淑月杜亚茹赵明
- 关键词:农业领域公理病虫害
- 基于Web的蔬菜领域本体概念和分类关系学习方法研究被引量:1
- 2015年
- 本体学习是当前本体研究的热点之一。概念的抽取和分类关系的构建是本体学习的关键。领域概念的分类方式很多,如何根据不同的应用目的,生成合适的分类结构,是当前本体学习系统应该着重考虑的问题。论文提出了一种有指导的领域本体概念体系结构学习方法,该方法以中文Web上蔬菜领域非结构化文本为语料,将浅层句法分析等语言学方法与TFIDF和C-值等统计学方法相结合进行概念抽取;在分类关系抽取时,基于目标本体的已知一个分支,采用余弦距离计算概念与已知分支概念的语义距离,并结合概念之间的共现频度来确定层次及上下位关系。与目前中文本体的代表性方法相比,文中提出的方法在查全率和查准率方面有明显的提高。
- 杜亚茹孙琛赵明
- 关键词:蔬菜本体学习
- 植物领域知识图谱构建中本体非分类关系提取方法被引量:15
- 2016年
- 采用本体学习的方法,以百度百科植物类词条内容的非结构和半结构化中文文本信息作为语料进行处理。使用一种有指导的基于依存句法分析的词汇-语法模式来获取植物领域的概念、分类和非分类关系,并分别利用基于词表过滤的方法和给模式添加限制的方法,较大程度地提高了关系抽取的精确度,完成在轻量级本体的基础上自动构建重量级本体。该方法建立了一个特定领域语料的概念层次,提高了最具代表性的分类和非分类关系的发现,并使用OWL语言形式化表达抽取结果。实验表明,该方法在非分类关系抽取上取得了较好的结果,为该领域知识图谱构建奠定了基础。
- 赵明杜亚茹杜会芳张家军王红说陈瑛
- 关键词:非分类关系本体学习百度百科