王清
- 作品数:8 被引量:43H指数:4
- 供职机构:安徽工业大学管理科学与工程学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学研究项目安徽省高等学校优秀青年人才基金更多>>
- 相关领域:自动化与计算机技术电子电信经济管理更多>>
- 一种基于概率校正和集成学习的肠癌肝转移预测模型被引量:5
- 2011年
- 提出一种基于概率校正和集成学习的机器学习模型,用来预测患者肠癌肝转移的概率。首先将AdaBoost和Class-bal-anced SVM的概率结果进行校正,再将其结果和Logistic回归的预测结果进行集成,获得最终的预测结果。预测模型在复旦大学附属肿瘤医院的肠癌患者数据集上与其他算法如AdaBoost、Class-balanced SVM、Logistic回归算法进行了比较,结果显示该模型具有更好的AUC性能,更适合于医生的临床辅助诊断。模型的AUC性能在UCI数据集上进一步得到了验证。
- 吕奕王清
- 关键词:生物信息学医学信息学
- 融合DSTM和USTM方法的主题模型被引量:1
- 2014年
- 当前监督或半监督隐藏狄利克雷分配(latent Dirichlet allocation,LDA)模型多数采用DSTM(downstream supervised topic model)或USTM(upstream supervised topic model)方式加入额外信息,使得模型具有较高的主题提取和数据降维能力,然而无法处理包含多种额外信息的学术文档数据。通过对LDA及其扩展模型的研究,提出了一种将DSTM和USTM结合的概率主题模型ART(author&reference topic)。ART模型分别以USTM和DSTM方式构建了文档作者和引用文献的生成过程,因此可以对既包含作者信息又包含引用文献信息的文档进行有效的分析处理。在实验过程中采用Stochastic EM Sampling方法对模型参数进行了学习,并将实验结果与Labeled LDA和DMR模型进行了对比。实验结果表明,ART模型不仅拥有高效的文档主题提取和聚类能力,同时还拥有优良的文档作者判别和引用文献排序能力。
- 江雨燕李平王清李常训
- 关键词:文档聚类LATENTDIRICHLET
- 平均1-依赖决策树集成算法被引量:7
- 2010年
- 基于平均1-依赖贝叶斯分类器(AODE)算法的思想,提出了平均1-依赖决策树集成算法(AODT),该算法通过使用每个输入属性和类别属性共同建立集成学习中的个体决策树分类器.同时,我们从多任务学习的角度探讨了AODE和AODT算法的工作原理.通过在Weka平台上使用40个UCI数据集的实验结果表明,该算法可以显著提高决策树学习算法的分类性能,并且具有很好的抗噪声性能.
- 周传华王清吴科主赵保华
- 关键词:多任务学习决策树学习算法
- 基于共享背景主题的Labeled LDA模型被引量:17
- 2013年
- 隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果.
- 江雨燕李平王清
- 关键词:文本分析多标记学习半监督聚类
- 基于交叉熵方法的选择性AODE算法被引量:1
- 2009年
- AODE(Averaged One-Dependence Estimators)算法是最近提出的一种典型的基于naveBayes的改进算法,并受到国际机器学习界的关注。交叉熵方法(Cross-entropy Method)是一种解决组合优化问题的全局随机搜索算法,已经成功地被应用到许多经典的NP问题中。给出了AODE算法选择性集成的理论基础,并基于交叉熵方法,提出了解决AODE算法选择性集成的CESAODE(Cross-Entropy method for Selective AODE)算法。在WEKA平台上使用UCI数据集进行的仿真实验结果表明,CESAODE算法比现有的分类算法,例如AODE等具有更好的分类性能。
- 周传华王清赵保华韦伟
- 关键词:AODE交叉熵方法M估计
- Java程序设计教学改革的新思路被引量:2
- 2013年
- 对目前Java程序设计语言教学中存在的若干问题进行了分析和研究,强调教学目的是使学生深刻掌握面向对象编程思想以及Java编程应用能力。从教学方法、教学内容、应用大数据的需求等方面提出了若干改进措施,并在实际教学过程中取得了积极的效果。
- 王清
- 关键词:JAVA程序设计教学内容教学方法大数据
- WDM全光网络中优化组播路由的遗传算法被引量:1
- 2006年
- 在WDM网络中,路由和波长分配是紧密联系在一起的,即在建立光连接的过程中,不但需要确定路由,还要为该路由分配合适的波长资源。该文给出了一种遗传算法以解决在给定一组时延受限的组播请求的情况下,如何为这些组播请求建立合适的组播路由树,从而使得该组组播树所占用的波长数最小的问题。通过使用一种合适的二维染色体编码表示,并设计适合问题的交叉和变异操作,从而算法可以有效地搜索假设空间,实验模拟结果表明了该算法具有快速有效的特点。
- 王清欧阳伟曹文君
- 关键词:WDM网络波长分配遗传算法
- 用于多标签分类的改进Labeled LDA模型被引量:11
- 2013年
- 概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言处理等领域的重点研究方向.本文通过对隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)及其扩展模型的研究,提出一种适用于文档多标签判定的改进Labeled LDA模型.模型中的标记被映射为多个主题的组合,其中包含若干个独享的主题和共享主题.在文档类别判定过程中通过联合独享主题和共享主题来对类别进行预测.为了验证算法的有效性本文将提出的模型分别与PLDA模型及其他非主题模型进行了对比.实验结果表明,改进LabeledLDA模型能够有效解决PLDA模型无法有效分析类别标记之间共享主题的问题,具有明显优于PLDA和其他非主题模型的多标签判定能力.
- 江雨燕李平王清
- 关键词:主题模型