海南省自然科学基金(80638)
- 作品数:5 被引量:17H指数:2
- 相关作者:张春元伍小芹康耀红易家傅林志阳更多>>
- 相关机构:海南大学更多>>
- 发文基金:海南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Web新闻自动采集发布系统的设计与实现被引量:7
- 2009年
- 针对新闻网站通过人工方式采集发布来自其它网站的Web新闻费时费力、易重采与漏采这一问题,综合运用Web信息采集技术、网页去噪技术、文本文档消重技术以及文本自动分类技术设计并实现了一种基于网络爬虫的Web新闻自动采集发布系统。在给出系统总体结构的基础上,对其各个模块的功能、设计与实现方法进行了详细介绍。实验表明,该系统设计合理,具有采集效率高、消重准确、集成方便、运行费用低等优点,可作为新闻网站的采编工具加以推广使用。
- 张春元康耀红伍小芹
- 关键词:网络爬虫网页去噪
- Web信息检索排序算法研究被引量:2
- 2009年
- 系统地研究了Web信息检索常用排序算法,即基于Web页面内容的排序算法、基于Web页面链接分析的排序算法和基于检索用户的排序算法,并对其优缺点进行了分析.在此基础上,对Web信息检索排序算法的发展趋势进行了展望.
- 张春元康耀红伍小芹
- 关键词:WEB信息检索网页排序算法
- 文本分类中特征选择方法研究被引量:8
- 2008年
- 对四种特征选择方法:互信息、信息增益、x2统计和期望交叉熵作了简要的介绍,并且结合KNN分类算法,使用查全率、查准率、宏平均和微平均对四种特征选择方法分别进行评估,提出并讨论了互信息修正的两种方法。
- 王维娜康耀红伍小芹
- 关键词:文本分类互信息信息增益期望交叉熵
- 一种眼睛精确定位的人脸检测方法
- 2009年
- 提出了一种图像生成的概率模型,通过检测人脸区域与该区域内人脸的特征,获得最佳的推理算法.该方法将图像分割成若干任意大小区域,包括人脸区域与背景区域,其目的是对相似度模型进行改进,以便判别人脸与背景区域的生成部分,然后利用GentleBoost算法定位出任意图像的人脸和人眼部分.实验结果表明,采用该方法能获得较好的效果,具有一定的使用价值.
- 林志阳张群东张春元易家傅
- 关键词:人脸定位人脸检测
- 基于大规模本体的有效匹配研究
- 2009年
- 为了改善不同领域专家构建的本体存在不匹配的问题,以及大规模本体问题已经超过当前的匹配方法,笔者设计了一种基于模块化的方法,其思路是把一个大的匹配问题分解成几个小的匹配问题,以减少急剧变化的复杂性.为了验证该方法,选定了几个较大和复杂的本体来测试.结果表明,基于模块化的方法(MOM)在保持较好的准确率和查全率的同时还可以较大地减少匹配时间.
- 林志阳张春元高喆易家傅
- 关键词:本体匹配领域本体