公共文化服务平台

胡小华: 作品数：10 被引量：101H指数：3; 供职机构：华中师范大学更多>>; 发文基金：国家自然科学基金湖北省自然科学基金国家科技支撑计划更多>>; 相关领域：自动化与计算机技术生物学文化科学更多>>

合作作者

基于句法语义特征的中文实体关系抽取被引量：48: 2014年; 实体关系抽取的核心问题是实体关系特征的选择。以往的研究通常都以词法特征、实体原始特征等来刻画实体关系,其抽取效果已难再提高。在传统方法的基础上,该文提出一种基于句法特征、语义特征的实体关系抽取方法,融入了依存句法关系、核心谓词、语义角色标注等特征,选择SVM作为机器学习的实现途径,以真实新闻文本作为语料进行实验。实验结果表明该方法的F1值有明显提升。; 郭喜跃何婷婷胡小华陈前军; 关键词：句法特征语义特征实体关系抽取 SVM

一种基于BSO优化的蛋白质复合物识别方法: 本发明提供一种基于BSO优化的蛋白质复合物识别方法。包含有如下步骤：利用BSO算法强大的全局寻优能力，将蛋白质相互作用网络看成全网络连通图，结合蛋白质的基因本体注释功能信息和蛋白质相互作用网络拓扑结构定义蛋白质节点之间的...; 沈显君胡小华何婷婷杨进才; 文献传递

一种蛋白质复合物识别方法: 本发明公开了一种蛋白质复合物识别方法，其将蛋白质基因表达数据、GO功能注释数据及其相互作用数据进行整合，构建了多源动态蛋白质网络，然后基于局部密度与相对距离对蛋白质节点进行聚类，并对初始的蛋白质复合物聚类模块基于聚类偏好...; 沈显君蒋兴鹏胡小华何婷婷周锦解丹; 文献传递

海洋生态系统生物学简介被引量：2: 2013年; 微生物以极大的数量统治了全球海洋,但是对其群体动力学、代谢复杂性以及协同作用等仍知之甚少。近年来,大规模测序技术的应用,尤其是宏基因组测序和16S rRNA测序已经逐渐成为研究海洋微生物生态系统的主要工具。这种不培养单个物种,而是直接通过测序提取所有微生物个体的遗传信息去研究微生物生态系统的成分和功能的方法,极大地促进了人们对海洋微生物世界的认识。本文简要介绍海洋生态系统学中的基本问题和最新计算分析方法。; 蒋兴鹏胡小华; 关键词：数据降维非负矩阵分解动力学模型

微生物组学的大数据研究被引量：2: 2015年; 微生物组学大数据在生态环境、人类健康和疾病研究方面都起到了重要作用。通过数学、统计等数据挖掘方法,从高维复杂数据中提取有用信息,是微生物组学大数据建模和分析的关键问题。本文分析了微生物组学大数据的特点,对当前数据分析和计算研究中存在的热点和难点进行了探讨分析,并综述了当前微生物组学大数据模式挖掘、网络重建与分析的研究概况。; 蒋兴鹏胡小华; 关键词：大数据数据挖掘代谢网络

一种高效的数据流挖掘增量模糊决策树分类算法被引量：27: 2007年; 数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题.Gama等对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性.Peng等在传统数据挖掘环境下提出了基于模糊理论的连续属性平滑离散化方法.基于前述工作,作者设计并实现了一种基于线索化排序二叉树的增量模糊决策树分类算法fVFDT,其主要贡献有如下4点:(1)第一次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,fVFDT的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而fVFDT只需要更新相应的一个节点即可;(2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n);(3)根据Fayyad等的研究成果,相比VFDTc,fVFDT只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn);(4)改进了传统数据挖掘环境下的基于模糊理论的连续属性平滑离散化方法,有效地处理了噪声数据,很好地提高了分类精度.; 王涛李舟军胡小华颜跃进陈火旺; 关键词：数据流

数据挖掘技术在软件工程中的应用综述被引量：19: 2009年; 随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经不能适应新的需求,而数据挖掘技术的引入为实现知识智能型软件工程提供了重要契机。以软件工程领域中的数据对象为主线,对在程序代码分析、故障检测、软件项目管理、开源软件开发等软件活动中所运用到的数据挖掘技术进行了系统的介绍和归纳,并在每一环节作了方法间的优劣性对比分析。最后还指出了若干值得进一步研究的方向。; 毛澄映卢炎生胡小华; 关键词：数据挖掘软件工程软件项目管理开源软件

基于位置语言模型的中文信息检索系统的研究被引量：3: 2015年; 在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、BM25概率模型、统计语言模型。; 陈雅兰胡小华涂新辉何婷婷

一种基于BSO优化的蛋白质复合物识别方法: 本发明提供一种基于BSO优化的蛋白质复合物识别方法。包含有如下步骤：利用BSO算法强大的全局寻优能力，将蛋白质相互作用网络看成全网络连通图，结合蛋白质的基因本体注释功能信息和蛋白质相互作用网络拓扑结构定义蛋白质节点之间的...; 沈显君胡小华何婷婷杨进才; 文献传递

基于冗余的仿真问答系统的轻量级局部文本分析: 2009年; 近年来,基于冗余的仿真问答系统因其轻量性及高效性受到越来越多的关注。与分析法不同的是,冗余法不需要大量的语料库也能得到满意的检索结果。这些方法通常重视全文信息而忽视局部环境,而局部环境往往可能包含了大量关于自然语言问题和答案间语义及语法关系的信息。本文中,我们介绍了一种新的轻量级局部文本分析技术以及实现该技术的Askdragon问答系统。该系统只需向搜索引擎提交一个不太严谨或较为模糊的问题,然后选取小部分高质量的检索结果进行答案抽取即可。问答系统在保持较高精度的同时还显著提升了效率。文章最后使用TREC(Text Retrieval Conference)问题集和四个时间类问题集对该系统进行了评测,评测结果显示系统的性能可以匹敌甚至超越了目前最先进的问答系统,如ARANEA和QUANTA。; 胡小华刘轩刘丹陆伟; 关键词：问答系统

胡小华

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

胡小华

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈