邱韬奋
- 作品数:4 被引量:2H指数:1
- 供职机构:暨南大学信息科学技术学院更多>>
- 发文基金:广东省科技计划工业攻关项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于SOA的远程教育系统的研究与实现
- 2011年
- 本文首先分析了高校传统教学模式存在的不足,提出了建设现代远程教育系统的目标。将SOA引入到远程教育的信息化系统资源建模中,提出了满足现代远程教育的SOA框架平台,以及统一信息管理方面的其他服务.
- 罗国伟郭信江丘洁飞邱韬奋
- 关键词:远程教育系统SOAWEB服务
- 基于网页聚类的Web信息自动抽取被引量:1
- 2011年
- 针对现今较流行的动态Web网页数量巨大、数据价值高,并且网页结构高度模板化的特点,设计了一个基于网页聚类的Web信息自动抽取系统。在DOM抽取技术基础上利用网页聚类寻找高相似簇,并引入列相似度和全局自相似度计算方法,提高了聚类结果的准确性。抽取模板中应用了可选节点对模板的修正和调整,以提高内容节点的正确标识。实验结果表明,该方法能够自动寻找并抽取网页主要信息,达到了较高的准确率和查全率。
- 邱韬奋杨天奇曾洪波
- 关键词:WEB信息抽取网页聚类
- 一种基于模糊理论的KNN文本分类算法被引量:1
- 2011年
- 传统的KNN文本分类算法在处理不均匀数据时,尤其是小型数据,容易受到边缘数据的干扰,导致分类效果明显下降。对此,本文提出一种基于模糊理论的KNN文本分类算法,该算法根据模糊理论的思想计算样本的隶属度函数,更合理地处理训练样本权值。实验表明,基于模糊理论的KNN算法能有效的弱化这些干扰,并在分类准确度上也有一定的提高。
- 曾洪波杨天奇邱韬奋
- 关键词:文本分类KNN隶属度函数
- 基于聚类算法的Web信息抽取技术研究
- 随着Internet的快速发展,Web已经发展成为一个庞大而复杂的信息资源。目前Web数据大都以HTML页面的形式出现,而且页面结构大都呈结构化或半结构化,由数据提供网站动态生成。其中一类非常有代表性的网站就是商品信息网...
- 邱韬奋
- 关键词:信息抽取网页聚类语义标注