陈沈焰
- 作品数:4 被引量:56H指数:4
- 供职机构:南京工业大学电子与信息工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于条件随机域CRF模型的文本信息抽取被引量:11
- 2008年
- 为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRF建立抽取模型,提出了一种文本信息抽取的方法。该方法对文本分析后加标注,确定文本特征集,采用有限内存拟牛顿迭代方法L-BFGS算法估计CRF模型参数,根据训练学习得出的模型,实现科研论文数据集头部文本信息的抽取。实验结果表明,使用CRF模型的抽取准确率达到90%以上,远远高于使用HMM模型的抽取准确率。
- 周晶吴军华陈佳陈沈焰
- 关键词:条件随机域文本信息抽取特征集
- 蚁群算法在网站优化方面的应用被引量:4
- 2008年
- 随着Internet和Web技术的发展,Web上的信息正以惊人的速度不断增长,用户在众多的信息中获取自己所需要的信息变得越来越困难.针对这个问题,提出了一种基于蚁群算法的网站优化算法,通过统计得到的Web日志相关数据项,计算得到任意页面间的转移概率,并利用转移概率实现网站的优化.实验结果表明,该算法能有效地实现网站优化.
- 陈沈焰吴军华
- 关键词:蚁群算法WEB日志网站优化
- 基于本体的概念语义相似度计算及其应用被引量:36
- 2008年
- 概念的语义相似度计算是自然语言处理研究的重要组成部分,也是人工智能应用中亟待解决的问题.本体作为共享概念模型的明确的形式化的规范说明,给概念语义相似度的计算带来了新的生机,从而提出了一种基于本体的计算概念间语义相似度的方法,综合考虑了语义距离、节点深度和节点密度的影响,并加入了一个可调节的参数,以适应不同场景下的灵活应用,最后简单介绍了语义相似度在搜索引擎领域的应用.
- 陈沈焰吴军华
- 关键词:本体语义相似度搜索引擎
- 基于本体的智能信息检索系统研究被引量:5
- 2009年
- 针对传统的信息检索系统存在的不足,提出了一种基于本体的智能信息检索模型。该模型充分利用了本体在语义表达方面的优势,主要介绍了它的设计思想、每个组成部分的功能以及其工作流程。
- 陈沈焰吴军华
- 关键词:本体信息检索