您的位置: 专家智库 > >

孙晓平

作品数:11 被引量:43H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇专利
  • 2篇期刊文章
  • 1篇学位论文
  • 1篇科技成果

领域

  • 5篇自动化与计算...

主题

  • 4篇标签
  • 3篇疾病预测
  • 3篇计算机
  • 2篇医疗信息
  • 2篇医疗信息技术
  • 2篇异构
  • 2篇有效信息
  • 2篇匹配度
  • 2篇问诊
  • 2篇集成分类器
  • 2篇疾病
  • 2篇疾病诊断
  • 2篇计算机领域
  • 2篇规则库
  • 2篇分类器
  • 2篇标签分类
  • 2篇标签数据
  • 2篇病例数据
  • 1篇对等网
  • 1篇对等网络

机构

  • 11篇中国科学院
  • 1篇首都医科大学...
  • 1篇中国中医科学...
  • 1篇中国科学技术...
  • 1篇中国中医科学...

作者

  • 11篇孙晓平
  • 7篇孙毓忠
  • 7篇刘鹏鹤
  • 3篇张书涵
  • 2篇诸葛海
  • 1篇姚二林
  • 1篇张均胜
  • 1篇程伟
  • 1篇刘志辉
  • 1篇星芸鹏
  • 1篇李向
  • 1篇王晓青
  • 1篇张磊

传媒

  • 1篇计算机学报
  • 1篇情报学报

年份

  • 1篇2023
  • 1篇2022
  • 3篇2019
  • 4篇2017
  • 2篇2007
11 条 记 录,以下是 1-10
排序方式:
一种基于异构集成模型的疾病预测系统
本发明提出一种基于异构集成模型的疾病预测方法及系统,涉及智能医疗以及医疗信息技术领域,该方法包括步骤1,获取多标签数据集,并训练K个适用于门诊病例数据集的多标签基础分类器,对所述多标签基础分类器进行集成,获取异构集成模型...
刘鹏鹤孙晓平孙毓忠
文献传递
一种基于智能推理的辅助疾病诊断的系统
本发明提出一种基于智能推理的辅助疾病诊断的方法及系统,涉及计算机领域,该方法包括获取用户的输入信息并进行解析,将输入信息中的有效信息进行存储,计算所述有效信息在病例库中的信息匹配度以及在规则库中的规则覆盖率,对所述信息匹...
刘鹏鹤张书涵孙晓平孙毓忠
文献传递
一种适用于多标签分类的ML‑kNN改进方法和系统
本发明涉及一种适用于多标签分类的ML‑kNN改进方法和系统,包括:在原始数据集中统计每类标签的样本总数,作为标签样本数,在每类标签的样本中统计每类特征的样本总数,作为特征样本数,并根据该标签样本数和该特征样本数计算特征标...
刘鹏鹤孙晓平孙毓忠
文献传递
用于多维数据的存储方法、查询方法及维护方法
本发明提供一种用于多维数据的存储方法,包括:获取待存储的多个资源数据,提取资源数据的正交属性,并以一个正交属性为一个维度构建待存储的多个资源数据对应的维度,每个资源数据的不同属性值对应于不同属性所在维度的一个坐标点,所有...
诸葛海孙晓平
结构化对等网络区间查询技术研究
随着互联网硬件和数据信息资源规模高速膨胀,支持大规模网络环境下可扩展的资源管理和共享面临挑战.结构化对等网络支持大规模异构网络环境下的高效查询路由,可以作为底层平台构建面向大规模用户、可扩展的分布式网络平台,实现语义丰富...
孙晓平
关键词:结构化对等网络语义覆盖网资源管理
文献传递
面向不均衡医学数据集的疾病预测模型研究被引量:41
2019年
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显著提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择三种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在
陈旭刘鹏鹤孙毓忠沈曦张磊王晓青孙晓平程伟
关键词:疾病预测不均衡数据集欠采样
知识网格模型与方法
诸葛海孙晓平姚二林星芸鹏李向
该项目属计算机软件领域,研究大规模人机互联环境的资源组织和共享问题,研究内容如下:(1)提出了资源空间模型及其范式、完整性和操作完备性理论。通过构造对等网语义覆盖层,构建了兼备规范组织与自组织的资源组织模型与方法,解决了...
关键词:
关键词:计算机软件知识网格建模方法
面向智能临床辅助决策支持系统的知识库构建方法与系统
本发明提出一种面向智能临床辅助决策支持系统的知识库构建方法与系统,涉及知识库的构建领域,该方法包括获取输入信息,对所述输入信息进行分词处理、词性标注以及语法分析,获取关系依赖树,提取所述关系依赖树中的概念、实体、实体修饰...
张书涵刘鹏鹤孙晓平孙毓忠
文献传递
一种基于异构集成模型的疾病预测方法及系统
本发明提出一种基于异构集成模型的疾病预测方法及系统,涉及智能医疗以及医疗信息技术领域,该方法包括步骤1,获取多标签数据集,并训练K个适用于门诊病例数据集的多标签基础分类器,对所述多标签基础分类器进行集成,获取异构集成模型...
刘鹏鹤孙晓平孙毓忠
自动迭代聚类数据集训练的虚假信息识别方法被引量:2
2023年
随着互联网虚假信息日益泛滥,自动识别虚假信息成为互联网信息治理的迫切需求。互联网上虚假信息伴随新事件不断产生,导致识别虚假信息的有监督统计机器学习模型需要不断更新迭代。每次迭代更新都需要构建新的训练集,以便新的虚假信息能在训练集中得以体现。为此,本研究提出一种动态迭代更新训练集构筑机器学习模型的虚假信息识别方法,设计基于核密度估计的迭代聚类方法对虚假信息数据集进行迭代聚类。在每一个自动得到的聚类中,按比例分别选取训练集样本和测试集样本构造分类器的训练样本集和测试样本集,使新产生事件的样本能够在训练集中得到体现。研究结果显示,基于核密度估计的迭代聚类方法划分数据集训练得到的虚假信息分类器,与随机划分数据集策略相比,能够显著提升虚假信息分类准确度。
张均胜孙晓平刘志辉
关键词:聚类核密度估计虚假信息
共2页<12>
聚类工具0