张玉红 作品数:62 被引量:179 H指数:9 供职机构: 合肥工业大学 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 医药卫生 更多>>
一种快速的基于特征选择的跨领域情感分类方法 2015年 已有的跨领域情感分类方法多通过抽取公共特征空间或建立领域特定特征间的映射关系来消减领域间的差异性,由于不考虑特征情感区分力的差异,使得公共特征空间及特征映射的求解往往不准确。具有高区分力的特征对于文本情感分类具有重要的意义,但标记的缺失使得已有的特征选择方法难以应用。文章基于特征选择方法,提出一种快速的跨领域情感分类方法(cross-domain sentiment classification based on feature selection,CSFS),构建源领域特征与目标领域特征的词共现矩阵,基于该矩阵对目标领域特征的情感区分力进行评估,在目标领域中选择出其中具有高情感区分力的特征;再利用源领域信息计算目标领域特征的情感语义大小,从而构建目标领域分类器。实验结果表明,该方法在保证准确率的前提下,大大提高了跨领域分类的效率。 徐旭 胡学钢 张玉红关键词:情感分类 基于分布式概念格的分类规则挖掘 被引量:2 2007年 以概念格为分类模型,引入知识合并思想,并针对大规模数据的分类求解以及过拟合问题引入剪枝策略,从而得到分类剪枝概念格模型,在此基础上提出了基于分布式概念格模型的强分类规则提取算法;通过理论证明了算法的正确性,并通过实验证明了算法的可行性。 胡学钢 陈慧 张玉红 马冯关键词:分布式数据挖掘 概念格 过拟合 剪枝 一种基于深度稀疏自编码机的迁移学习方法 本发明公开了一种基于深度稀疏自编码机的迁移学习方法,包括:(1)数据集向量化的前期预处理。(2)模型设计和实现。(3)应用Stacked RICA算法得到的提取特征做半监督学习。(4)特征提取完后,用logistic回归... 胡学钢 张玉红 朱毅 李培培 周鹏文献传递 K-split Lasso:一种有效的肿瘤特征基因选择方法 随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而为研究肿瘤特征基因选择和亚型分类提供了方便,其成为生物信息学领域的研究热点.然而,面对高维小样本的肿瘤基因表达谱数据,如何在成千上万个基因... 张靖 胡学钢 张玉红 施万锋文献传递 一种基于转折句语义块划分机制的情感分类方法 本发明公开了一种基于转折句语义块划分机制的情感分类方法,其步骤包括:1.利用已知的词向量字典,把训练集和测试集中的每条样本表示为词向量矩阵;2.选取合适的卷积核对词向量矩阵进行卷积,提取映射特征向量以实现降维;3.构建转... 张玉红 王勤勤 李玉玲 李培培 胡学钢文献传递 一种基于自适应噪音降噪编码器的跨领域文本分类方法 本发明公开了一种基于自适应噪音降噪编码器的跨领域文本分类方法,其特征是:采用适用于跨领域任务的特征选择方法,过滤在源领域数据集合和目标领域数据集合中的样本中出现频率较低和无意义的特征词,并跟据源领域集合和目标领域集合中的... 张玉红 杨帅 李玉玲 李培培一种基于主动贝叶斯分类技术的垃圾邮件过滤方法 被引量:1 2008年 目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点。对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性。 李笛 张玉红 胡学钢关键词:垃圾邮件 文本分类 信息过滤 贝叶斯分类 一种基于类与特征分布的多标签数据流中概念漂移检测方法 本发明公开了一种基于类与特征分布的多标签数据流中概念漂移检测方法,包括:1、根据滑动窗口机制将多标签数据流划分成数据块;2、统计数据块的类标签数据分布,并根据余弦相似度函数与海明损失函数计算类标签分布差异度,用于判断数据... 李培培 李磊 张玉红 胡学钢 刘俊峰 何路 吴共庆 吴信东文献传递 基于VPRS的近似概念格模型及其构造 不确定知识的提取是机器学习和数据挖掘领域一个重要的研究课题。概念格是一种精确的、有效的知识发现模型,难以处理用户感兴趣的不确定知识。VPRS 模型是处理不确定知识的一种有效工具。本文将 VPRS 引入概念格,提出一种近似... 张玉红 胡学钢 刘晓平关键词:概念格 不确定信息 文献传递 基于动态权重的多源联合自适应和内聚性特征提取方法 本发明公开了一种基于动态权重的多源联合自适应和内聚性特征提取方法,是首先对多个源域的样本进行对齐,在对齐的过程中学习一种实时度量差异的动态权重;然后使用细粒度的度量指标使源域和目标域对齐;再利用多个分类器形成对抗,通过对... 张玉红 杜明轩