何清
- 作品数:104 被引量:1,586H指数:14
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学文化科学经济管理更多>>
- 基于Spark的高效并行自动编码机被引量:1
- 2018年
- 机器学习中一个非常关键的问题就是如何获取良好的数据特征表示,许多经典的特征提取方法是基于数据间关系或利用简单线性组合降维后得到数据的特征表示。其中深度学习算法在各种学习任务中都可以取得良好的效果,而且可以学到很好的数据特征表示。但现有深度学习算法或模型大多为单机串行实现,不能处理较大规模的数据且运行时间较长。本文设计实现了一种基于Spark分布式平台的高效并行自动编码机,该编码机可以有效地进行特征表示学习,并且利用分布式计算平台Spark对算法进行加速,优化了对稀疏数据的操作,大大提升了运行效率。本文通过在文本数据特征学习以及协同过滤两个任务上的实验,表明本文所实现的并行自动编码机的有效性和高效性。
- 庄福振钱明达申恩兆张大鹏何清
- 关键词:SPARK
- 一种采用决策树的数据分类方法和系统
- 本发明公开了一种采用决策树的数据分类方法和系统。所述方法,包括下列步骤:基于MapReduce机制,并行计算训练数据中包含的每个属性的信息增益,选出最佳的分裂决策属性作为节点构造决策树;根据所述决策树,对输入的数据记录进...
- 庄福振何清
- 文献传递
- 机器学习与文本挖掘若干算法研究
- 本文研究了机器学习和文本挖掘的若干算法。在第一部分,针对支持向量机对海量数据进行分类遇到的困难,基于拓扑学中的Jordan曲线定理,提出了基于分类超曲面的数据分类方法。这一部分研究工作主要有以下几方面创新: (1)...
- 何清
- 关键词:隐式马尔可夫模型自组织映射概念语义空间语义索引
- 文献传递
- 基于超曲面的多类分类方法被引量:3
- 2003年
- 使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分 .基于 Jordan曲线定理 ,提出了一种通用的基于分类超曲面的分类法 ,它是通过直接构造分类超曲面 ,根据样本点关于分类曲面的围绕数的奇偶性进行分类的一种全新分类判断算法 ,不需作升维变换 ,不需要考虑使用何种核函数 ,而直接地解决非线性分类问题 .对数据分类应用的结果说明 ,基于分类超曲面的多类分类法可以有效地解决非线性数据的分类问题 ,并能够提高分类效率和准确度 .
- 何清史忠植任力安
- 关键词:支持向量机
- 幂群的表示与同构提升
- 揭示了幂群及其生成群与拉丁方的联系。以拉丁方作为幂群的一种直观表示,研究了幂群性质在拉丁方中的表现。最后提出了群的同构提升的概念,并讨论了Hopf群与同构提升的联系。
- 何清李洪兴
- 关键词:幂群拉丁方
- 多策略数据库知识发现
- 王军史忠植叶施仁李晓黎宫秀军游湘涛何清刘少辉
- 该课题提出了基于元知识的多策略知识发现算法框架。通过采用元知识概念,将大大提高多策略KDD系统的开发调试工作。针对多策略问题,提出了集成多种采掘算法的基于数据仓库的采掘模型,并实现了基本原型系统。研究多种发现算法的可视化...
- 关键词:
- 关键词:知识发现数据挖掘
- 论域的模糊划分与仿真数据采集被引量:12
- 2001年
- 给出一类 MIMO模糊系统对紧集上连续函数的万能逼近定理的证明。在此证明基础上分析造成“规则灾难”的原因 ,提出基于覆盖重叠数的模糊划分方法和基于“线性”划分论域的方法 ,以及相应仿真数据的采集方法。
- 何清王加银李洪兴史忠植
- 关键词:模糊控制数据采集
- 模糊代数范畴与模糊聚类
- 该文包括两大部分内容.第一部分研究模糊代数范畴,主要围绕扩展原理的公理化、幂群与幂环、扩展原理所导出的范畴以及扩展原理在概念形成中的应用,作了以下工作:1、对合情扩展映射的公理化条件的完备性与独立性进行了讨论,给出了扩展...
- 何清
- 文献传递
- 描述型多维度事件序列的并行频繁情节挖掘方法与系统
- 本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计...
- 敖翔左罗罗平庄福振何清
- 一种新的海量数据分类方法被引量:14
- 2002年
- 使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分。文章则基于Jordan曲线定理,提出了一种通用的基于分类超曲面的分类法,它是通过直接构造分类超曲面,根据样本点关于分类曲面的围绕数的奇偶性进行分类的一种新分类判断算法,不需作升维变换,不需要考虑使用何种核函数,而直接地解决非线性分类问题。对数据分类应用的结果说明:基于分类超曲面的分类法可以有效地解决非线性数据的分类问题,并能够提高分类效率和准确度。
- 任力安何清史忠植
- 关键词:支持向量机人工智能