刘海 作品数:63 被引量:318 H指数:10 供职机构: 华南师范大学 更多>> 发文基金: 国家自然科学基金 广东省自然科学基金 广东省科技计划工业攻关项目 更多>> 相关领域: 自动化与计算机技术 文化科学 农业科学 经济管理 更多>>
人类基因组非冗余Exon/Intron数据库的构建 2010年 以Homo.sapiensRefSeq作为原始数据库来构建EID(Exon/Intron Database)可以克服GenBank所带来的冗余问题.通过分析RefSeq基因组数据库中每个CDS(Coding Sequence,编码序列),获得构建EID的相关的数据(基因的定义、基因标识符、基因序列、蛋白质标识符、蛋白质序列、外显子和内含子的数量、大小、总数、非翻译区(UTR)内含子、内含子相位、内含子剪切位点模式).结果表明,人类24条染色体(22条常染色体和2条性染色体,共计2 870 827355 bps)中含有32 157个基因标识符(gene blocks),其中7 398个基因为假基因,4 014个基因发生了可变剪切(Al-ternative Splicing,AS),15 533个基因含有CDS内含子,765个基因含有UTR内含子,2 585个基因不含有内含子,其他的为异常基因. 罗冬梅 金鹰 邓小元 刘海关键词:非翻译区 基于知识图谱表示学习的协同过滤推荐算法 被引量:43 2018年 针对协同过滤算法仅使用物品-用户评分矩阵而未考虑语义的问题,提出一种协同过滤推荐算法。使用知识图谱表示学习方法,将业界已有的语义数据嵌入一个低维的语义空间中。通过计算物品之间的语义相似性,将物品自身的语义信息融入协同过滤推荐。算法弥补了协同过滤算法没有考虑物品本身内涵知识的缺陷,在语义层面上增强了协同过滤推荐的效果。实验结果表明,该算法能够有效地提升协同过滤推荐的准确率、召回率和F值。 吴玺煜 陈启买 刘海 贺超波关键词:协同过滤 知识图谱 语义相似性 推荐系统 数据中心流量调度的分簇聚类算法仿真 被引量:1 2023年 为了避免数据中心出现信道拥塞问题,需要对数据中心中的流量展开调度处理,为此提出面向数据中心流量调度的分簇聚类算法。分析数据中心的拓扑结构,检测网络中存在的流量数据,通过梯度下降方法对多层感知机的参数展开调节,利用调节后的多层感知机对检测到的流量数据展开去噪处理,提升流量数据分簇精度。采用K-means算法分簇聚类处理去噪后的流量数据,通过网络带宽分配,在相关约束条件的基础上分簇调度流量数据,实现数据中心流量的调度。实验结果表明,所提方法的分簇精度较高,流量包的速率基本相同,表明所提方法具有较高的稳定性,调度效果较好。 屈晓 刘海关键词:数据中心 多层感知机 流量调度 网络带宽分配 基于分布式非负矩阵分解的大规模主题社区挖掘 被引量:3 2016年 复杂网络的主题社区挖掘具有重要的应用价值,但现有方法可扩展性差,无法高效挖掘大规模复杂网络的主题社区.针对该问题,提出一种基于分布式非负矩阵分解的主题社区挖掘方法:TCMDNMF(topic community mining based on distributed nonnegative matrix factorization),该方法基于非负矩阵联合分解模型,可以有效统一集成节点链接和内容信息挖掘主题社区.通过采用梯度下降方法对主题社区挖掘模型进行了优化求解,并引入L1范数作为稀疏性正则项以及基于Map Reduce分布式计算框架提高了关键算法的计算效率.实验结果表明,TCMDNMF不仅可以有效挖掘主题社区,而且具有高度可扩展性,可以有效解决大规模复杂网络主题社区挖掘带来的大数据量计算问题. 贺超波 汤庸 杨阿祧 赵淦森 刘海 黄昌勤关键词:复杂网络 非负矩阵分解 MAPREDUCE 梯度下降 时态的粒度刻画及演算问题研究 被引量:13 2010年 时态的建模及演算是时态信息处理中的逻辑基本问题,从粒度思想出发,根据时态的粒度划分,研究了时态粒度的语义与性质。并基于时态粒度对时态原语进行刻画,进而基于代数系统分析了时态的粒度转换算子及不同粒度下的时态关系,构建了时态粒度关系的演算系统。 左亚尧 汤庸 舒忠梅 李磊 刘海关键词:时态 粒度 基于改进对称二值非负矩阵分解的重叠社区发现方法 被引量:1 2020年 针对复杂网络社区结构具有重叠性的问题,目前已提出许多不同类型的解决方法,其中基于对称二值非负矩阵分解(SBNMF)的重叠社区发现方法是具有代表性的方法。然而,SBNMF在面对社区内部链接稀疏的网络时,其重叠社区发现性能低下,为此提出一种基于改进SBNMF(ISBNMF)的重叠社区发现方法。首先利用对称非负矩阵分解得到的因子矩阵构建社区内部链接稠密的新网络,然后再使用基于Frobenius范数的SBNMF模型对新网络的邻接矩阵进行分解,最后通过网格搜索法或梯度下降法得到可以显式指示节点的社区隶属关系的二值矩阵。在人工合成的和真实的网络数据集上进行大量实验,结果表明ISBNMF的社区发现性能优于SBNMF和其他代表性方法。 成其伟 陈启买 贺超波 刘海关键词:复杂网络 网格搜索 梯度下降 基于卷积神经网络的图像分类方法、系统、装置及介质 本发明公开了一种基于卷积神经网络的图像分类方法、系统、装置及介质,该方法包括获取待分类图像;利用训练好的图像分类卷积神经网络模型对所述待分类图像进行分类;获取所述训练好的图像分类卷积神经网络模型输出的分类结果。本发明通过... 潘文兵 陈启买 刘海 贺超波文献传递 基于源视图增量的在线实化视图自维护 被引量:2 2007年 借鉴传统的基于基表变化的数据仓库维护方法Strobe,提出一种基于源视图增量的在线实化视图自维护方法,使实化视图的状态保持与底层数据源的一致性。这种方法不仅保持数据仓库数据的一致性,而且还能够加快实化视图维护的速度,减少底层信息源与数据仓库之间的网络通信负担。 刘海 汤庸 陈启买关键词:数据仓库 时态信息处理中的时态约束与实现 时态信息处理已成为高级数据库技术研究的重要领域,自20世纪80年代以来,在基础理论、时态数据模型、时态数据语义、数据库语言和应用技术方面取得了丰硕的成果.在基础理论研究方面,加州大学洛杉矶分校的J.Ben Zvi在197... 刘海 杨坤 汤庸 汤娜关键词:时态信息处理 时态约束 数据库语言 数据库管理 关系数据库 文献传递 构建非冗余EID的若干技巧 2009年 基于GenBank构建的外显子内含子数据库(EID)含有大量的冗余数据.为了解决冗余问题,构建了基于RefSeq的非冗余EID(non-redundantEID).RefSeq是由NCBI工作人员负责维护和更新的参考序列库,为基因组注释、基因识别、基因突变、多态性分析、表达研究和比对分析提供了重要的参考.该EID可用于大规模分析Exon/Intron结构和内含子剪切(Splicing)的研究,并拥有一些内部机制来控制数据质量和可能出现的错误.同时,它的新的改进是增加了基因序列中非翻译区(UTR)的数据内容.该文对构建基于RefSeq的非冗余EID的一些技巧作出说明. 金鹰 邓小元 刘海关键词:剪切 非翻译区