徐庆鹏
- 作品数:6 被引量:9H指数:2
- 供职机构:安徽大学计算机科学与技术学院计算智能与信号处理教育部重点实验室更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种基于贪婪覆盖的文本分类方法被引量:1
- 2009年
- 文本分类是信息检索和数据挖掘中的重要主题之一。文中提出了一种基于贪婪覆盖算法的文本分类方法,首先对文本进行分词,分词的结果用CHI统计量的方法提取特征,使用TF-IDF-ICSD进行特征权重计算。对贪婪覆盖算法采用另一种选取初始点的方法来构建分类器,用复旦大学语料库作为测试数据集,并与BP算法相比较。实验结果表明文本提出的方法是有效的。
- 张燕平徐庆鹏苏守宝邢猛
- 关键词:文本分类
- 一种动态调整的蚁群聚类算法被引量:4
- 2009年
- 蚁群算法是优化领域中新出现的一种仿生进化算法,基于蚁群算法的聚类算法已经在当前的数据挖掘研究中得到应用。文中针对早期蚁群聚类算法的缺点,提出动态调整的蚁群聚类算法,通过加入运动速度不同的蚁群、半径自适应调整、短期记忆、强行放下等策略,来指导蚁群的移动行为,降低蚁群移动的随意性,减少了蚂蚁的搜索时间,提高聚类性能。仿真实验表明:改进算法能有效地提高算法效率且取得较好的聚类结果。
- 贾瑞玉邢猛徐庆鹏黄义堂
- 关键词:蚁群算法
- 一种基于资源优化神经网络(RON)的文本分类方法
- 2010年
- 应用有指导的机器学习方法实现了一个文本分类器。运用改进型的CHI统计量方法对分词结果进行特征提取,对传统的TF-IDF加权公式进行了一些改进(称之为:ETF-IDF),运用资源优化神经网络RON(Resource-optimizing Networks)构建分类器。在复旦大学提供的中文文本分类语料库上进行分类实验,实验结果表明该分类器较之BP算法有较高的分类质量,且ETF-IDF加权公式较之传统的TF-IDF加权公式有其优越性,提高了分类的精度和性能,满足了中文文本自动分类的要求。
- 张燕平乔立秋朱远枫徐庆鹏
- 关键词:文本分类RON
- 基于交叉覆盖算法的蛋白质二级结构预测方法
- 2009年
- 蛋白质二级结构预测在蛋白质空间结构预测中起着承上启下的重要作用。近年来,大量的方法应用于二级结构预测中,其中,神经网络算法效果较好。但是,由于传统的神经网络存在结构复杂、学习速度慢、运行效率低、处理海量数据困难的缺陷,大大影响了预测的效果,因此,该文将一种基于构造性神经网络算法,也就是交叉覆盖算法应用于蛋白质二级结构预测中,另外,为了引入更多的同源家族结构的信息,采用了基于概率的Profile编码方式。通过实验证明将交叉覆盖算法运用在蛋白质二级结构预测中的可行性.并且比传统的神经网络方法有了更高的准确率。
- 张燕平章晶徐庆鹏朱远枫
- 关键词:交叉覆盖算法蛋白质二级结构
- 基于覆盖算法的文本分类研究及应用
- 如今,在庞大而不断增长的网络资源中,使用户快速、准确地找到自己所需要的信息,是信息科学和相关技术领域面临的一大挑战。因此迫切需要一种能对这些资源进行自动分类的技术。文本分类便是其中一种,它可以较大程度解决文本信息杂乱的现...
- 徐庆鹏
- 关键词:文本分类垃圾短信
- 文献传递
- 基于词共现模型的垃圾邮件过滤方法研究被引量:4
- 2009年
- 垃圾邮件过滤就是对邮件做出是垃圾或非垃圾的判断。传统的表示邮件的方法是在向量空间模型基础上通过信息增益等特征选择方法提取一部分词来表示邮件内容,存在语义信息不足的问题。该文提出一种将传统方法和词共现模型结合起来表示邮件特征的新方法,再采用交叉覆盖算法对邮件进行分类得到邮件分类器。实验表明,该文提出的邮件过滤算法与传统方法相比提高了过滤性能,词共现选择的维度要比传统方法选择的维度更具有代表性。
- 张燕平史科徐庆鹏谢飞
- 关键词:计算机应用中文信息处理向量空间模型垃圾邮件过滤词共现模型交叉覆盖算法