谢振亮
- 作品数:4 被引量:119H指数:3
- 供职机构:天津大学电子信息工程学院计算机与信息技术系更多>>
- 发文基金:天津市科技发展战略研究计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于WEB挖掘技术的网页自动分类和聚类的研究
- 文本分类和文本聚类是信息处理中的两个重要工作.传统的分类和聚类算法主要针对纯文本文件,随着Internet的迅速发展,半结构化的Web数据慢慢占据了信息处理对象的主体,这使得文本分类和聚类算法得到了进一步的延伸和发展.该...
- 谢振亮
- 关键词:文本分类文本聚类WEB挖掘
- 文献传递
- 用C#实现带身份验证的robot程序
- 2005年
- 网络机器人是搜索引擎中的核心部分,其首要步骤是获取页面内容来分析和追踪其包含的链接,以便搜索更多的网页。出于某些安全和商业因素,有些网站的相关内容必须要在有效用户登录后才可以查看,所以其相关页面的下载,首先需要通过身份验证。这就需要使用HTTP用户认证机制来判别用户身份,本文主要论述了怎么样用C#来实现通过HTTP用户认证实现页面下载。
- 郭艳燕孟昭鹏谢振亮
- 关键词:网络机器人COOKIEC#
- Web日志挖掘中的数据预处理技术研究被引量:110
- 2003年
- 在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
- 赵伟何丕廉陈霞谢振亮
- 关键词:数据挖掘WEB日志挖掘数据预处理
- 基于网站结构挖掘的Web文档自动分类被引量:4
- 2003年
- 对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。
- 谢振亮何丕廉陈霞孟昭鹏