四川省教育厅青年基金(11ZB088)
- 作品数:4 被引量:6H指数:2
- 相关作者:郑皎凌文立玉舒红平宋艳任玉兰更多>>
- 相关机构:成都信息工程大学成都中医药大学四川大学更多>>
- 发文基金:四川省教育厅青年基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于扰动的亚复杂动力系统因果关系挖掘被引量:2
- 2014年
- 传统因果分析方法主要是基于具有分布预设的概率模型,但动力系统通常是存在反馈的非线性系统,不适合采用概率方法进行分析.针对这一问题,该文提出了基于扰动的亚复杂动力系统因果分析方法,主要工作包括:(1)采用基因表达式编程的函数拟合方法对动力系统时间序列进行差分方程拟合,减免了关于数据分布模型的预设;(2)基于得到的拟合函数,通过对自变量的扰动来计算因变量的相应波动,提出了根据扰动和波动的数值关系来判断自变量和因变量之间因果关系的判断准则,并基于该准则提出了因果关系挖掘算法和挖掘结果可信度验证方法;(3)在合成数据和真实数据上进行了翔实实验,结果表明该文所提出的算法能挖掘出合理因果关系,在不同数据规模情况下能得到一致挖掘结果.与两种基于概率统计的因果分析方法进行了对比实验,结果表明当系统要素多于两个时,该文的算法仍然能够得到多个要素间正确的因果关系,而两种基于概率统计的方法则无法挖掘出正确的因果关系.
- 郑皎凌唐常杰乔少杰杨宁李川陈瑜王悦
- 关键词:因果关系分析函数拟合数据挖掘
- 基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究被引量:4
- 2014年
- 词频反文档频率是文档特征权值表示的常用方法,用以评估单词对于语料库中的其中一份文件的重要程度。通过合理映射病例库与语料库的词汇关系,对词频反文档频率模型进行改进,并将改进后的词频反文档频率模型应用到针灸处方疾病症状权重挖掘中,计算出疾病所对应的各种症状权重。实验统计了106种疾病,其中与临床诊疗经验相符合的有84种,准确率达79.2%,实验表明改进的模型能得到较好的疾病症状权重鉴别效果。
- 宋艳何嘉舒红平郑皎凌梁繁荣任玉兰文立玉
- 关键词:词频疾病症状
- 演化聚类在离散制造业质量管理中的应用
- 2013年
- 针对离散制造业质量管理系统中维度高,且存在较多一致性数据的情形,设计了一种基于信息论中的信息熵,即互信息的改进聚类算法。通过实验分析,采用改进的聚类算法可有效提高聚类的正确率,并且通过演化聚类理论和方法的应用可对离散制造业质量管理提供有效的决策参考信息。
- 王鹏飞舒红平郑皎凌文立玉
- 关键词:信息熵互信息质量管理
- 基于分片的高维稀疏数据存储模式优化研究
- 2013年
- 针对大型数据库中高维稀疏关系表空字段对存储空间的占用问题,通过利用传统行存储数据库模拟列式存储数据库的工作原理,设计了一种基于分片的数据库结构。通过实验分析,数据库存储空间比原始模式降低了27.42%左右。在对高维稀疏数据中五个字段进行查询时,I/O数据块个数降低至原始模式的35.27%,对高维稀疏数据中四个字段进行查询时,I/O数据块个数降低至原始模式的28.22%,而随着字段的减少I/O数据块仍会进一步减少,从而提高了数据库的访问效率。
- 邵慧萌舒红平郑皎凌许源平文立玉
- 关键词:高维稀疏数据