您的位置: 专家智库 > >

德雷塞尔大学信息科学与技术学院

作品数:11 被引量:1,487H指数:7
相关机构:南京理工大学计算机科学与技术学院大连理工大学人文学院大连理工大学人文学院21世纪发展研究中心更多>>
发文基金:国家自然科学基金浙江省教育厅科研计划湖北省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学生物学更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 7篇自动化与计算...
  • 4篇文化科学
  • 1篇生物学

主题

  • 3篇粗糙集
  • 2篇知识
  • 2篇知识约简
  • 1篇等价
  • 1篇等价关系
  • 1篇动力学模型
  • 1篇信息可视化
  • 1篇信息系统
  • 1篇序关系
  • 1篇优势关系粗糙...
  • 1篇语言模型
  • 1篇知识传播
  • 1篇知识可视化
  • 1篇冗余
  • 1篇软件工程
  • 1篇软件项目管理
  • 1篇上近似集
  • 1篇数据降维
  • 1篇数据流
  • 1篇数据流挖掘

机构

  • 11篇德雷塞尔大学
  • 3篇大连理工大学
  • 3篇南京理工大学
  • 2篇嘉兴学院
  • 1篇国防科学技术...
  • 1篇湖南工业大学
  • 1篇华中科技大学
  • 1篇华中师范大学
  • 1篇北京航空航天...
  • 1篇武汉大学
  • 1篇浙江大学
  • 1篇江西财经大学

作者

  • 5篇胡小华
  • 3篇魏利华
  • 3篇唐振民
  • 3篇陈超美
  • 2篇杨习贝
  • 2篇丁辉
  • 2篇陈悦
  • 1篇刘丹
  • 1篇李舟军
  • 1篇涂新辉
  • 1篇王涛
  • 1篇侯海燕
  • 1篇刘则渊
  • 1篇梁永霞
  • 1篇王贤文
  • 1篇陈火旺
  • 1篇陆伟
  • 1篇吴刚
  • 1篇刘轩
  • 1篇侯剑华

传媒

  • 3篇计算机科学
  • 1篇计算机学报
  • 1篇图书情报知识
  • 1篇科学学与科学...
  • 1篇信息与控制
  • 1篇情报学报
  • 1篇科学与管理
  • 1篇南京理工大学...
  • 1篇数学建模及其...

年份

  • 1篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2010
  • 6篇2009
  • 1篇2007
11 条 记 录,以下是 1-10
排序方式:
一种高效的数据流挖掘增量模糊决策树分类算法被引量:27
2007年
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题.Gama等对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性.Peng等在传统数据挖掘环境下提出了基于模糊理论的连续属性平滑离散化方法.基于前述工作,作者设计并实现了一种基于线索化排序二叉树的增量模糊决策树分类算法fVFDT,其主要贡献有如下4点:(1)第一次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,fVFDT的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而fVFDT只需要更新相应的一个节点即可;(2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n);(3)根据Fayyad等的研究成果,相比VFDTc,fVFDT只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn);(4)改进了传统数据挖掘环境下的基于模糊理论的连续属性平滑离散化方法,有效地处理了噪声数据,很好地提高了分类精度.
王涛李舟军胡小华颜跃进陈火旺
关键词:数据流
数据挖掘技术在软件工程中的应用综述被引量:19
2009年
随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经不能适应新的需求,而数据挖掘技术的引入为实现知识智能型软件工程提供了重要契机。以软件工程领域中的数据对象为主线,对在程序代码分析、故障检测、软件项目管理、开源软件开发等软件活动中所运用到的数据挖掘技术进行了系统的介绍和归纳,并在每一环节作了方法间的优劣性对比分析。最后还指出了若干值得进一步研究的方向。
毛澄映卢炎生胡小华
关键词:数据挖掘软件工程软件项目管理开源软件
不完备模糊系统的优势关系粗糙集与知识约简被引量:8
2009年
以不完备模糊决策系统为研究对象,根据拓展的优势关系,构建了粗糙模糊集模型,以获取不完备模糊决策系统中的"at least"和"at most"决策规则。为了获取简化的"at least"和"at most"规则,在不完备模糊决策系统中,提出了两种相对约简(相对下近似约简与相对上近似约简)的概念,给出了求得这两种约简的判定定理及区分函数,并进行了实例分析。
魏利华唐振民杨习贝祁云嵩
关键词:粗糙模糊集相对约简
海洋生态系统生物学简介被引量:2
2013年
微生物以极大的数量统治了全球海洋,但是对其群体动力学、代谢复杂性以及协同作用等仍知之甚少。近年来,大规模测序技术的应用,尤其是宏基因组测序和16S rRNA测序已经逐渐成为研究海洋微生物生态系统的主要工具。这种不培养单个物种,而是直接通过测序提取所有微生物个体的遗传信息去研究微生物生态系统的成分和功能的方法,极大地促进了人们对海洋微生物世界的认识。本文简要介绍海洋生态系统学中的基本问题和最新计算分析方法。
蒋兴鹏胡小华
关键词:数据降维非负矩阵分解动力学模型
迈向科学学大变革的时代被引量:40
2009年
对国际科学学及科学计量学研究热点的可视化分析,表明充满变革性的纳米科技、生物科技、交叉科学和发现理论,正成为21世纪初科学学研究的焦点与热点,亦标志着科学学正进入大变革的时代。迅速崛起的e-科学研究前沿可视化分析,展示出基于网格技术的e-科学及其工作流,正在引起当代科学研究方式的深刻变革,也是对科学学大变革的时代呼唤。正在启动的NSF关于CDI的项目计划,创造了"赛博实现的发现与创新(CDI)"这一全新概念和基于计算思维的发现模式与创新模式;在这一背景下,一个由长江学者领军的科学学研究团队,开展了带有CDI变革性特征的多学科性、跨国性研究,并在此领域取得阶段性成果。
刘则渊陈超美侯海燕王贤文
关键词:科学学科学计量学CDI
基于位置语言模型的中文信息检索系统的研究被引量:3
2015年
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、BM25概率模型、统计语言模型。
陈雅兰胡小华涂新辉何婷婷
基于冗余的仿真问答系统的轻量级局部文本分析
2009年
近年来,基于冗余的仿真问答系统因其轻量性及高效性受到越来越多的关注。与分析法不同的是,冗余法不需要大量的语料库也能得到满意的检索结果。这些方法通常重视全文信息而忽视局部环境,而局部环境往往可能包含了大量关于自然语言问题和答案间语义及语法关系的信息。本文中,我们介绍了一种新的轻量级局部文本分析技术以及实现该技术的Askdragon问答系统。该系统只需向搜索引擎提交一个不太严谨或较为模糊的问题,然后选取小部分高质量的检索结果进行答案抽取即可。问答系统在保持较高精度的同时还显著提升了效率。文章最后使用TREC(Text Retrieval Conference)问题集和四个时间类问题集对该系统进行了评测,评测结果显示系统的性能可以匹敌甚至超越了目前最先进的问答系统,如ARANEA和QUANTA。
胡小华刘轩刘丹陆伟
关键词:问答系统
不完备区间值信息系统中的粗集理论被引量:18
2009年
针对不完备区间值信息系统,提出了一种用于分类的偏序关系,并给出了计算这种偏序关系约简的实际操作方法。在不完备区间值决策系统中,根据基于偏序关系的粗糙集模型,引入了上、下近似约简的概念。上、下近似约简是保持所有决策类的下、上近似都不发生变化的最小属性子集,借此获取简化的决策规则。
魏利华唐振民丁辉杨习贝李燕林
关键词:偏序关系粗糙集知识约简
CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化被引量:1330
2009年
本文介绍了在科学文献中识别并显示科学发展新趋势和新动态的一种通用方法的最新研究进展。这项研究在理论和方法上极大地促进了知识领域可视化研究。研究领域(specialty)的概念和可视化基于信息科学中的两个概念——"研究前沿"和"知识基础"间的时变对偶(time-variant duality)。研究前沿(research front)被定义为一组突现的动态概念和潜在的研究问题。研究前沿的知识基础(intellecture base)是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹。Kleinberg设计的跳跃检测算法(burst detection algorithm)适用于辨认新兴研究前沿专业术语概念。Freeman提出的中间中心性测度可以用来使表示潜在范式变化的关键点凸显出来。我们设计并实现了两个互补的视图:聚类视图(cluster views)和时区视图(time-zone views)。这种方法的贡献在于:①通过对研究前沿术语的算法运算,在动态中认识知识基础的本质 ②用研究前沿专业术语概念明确标出共引聚类的确切含义 ③直观地和靠算法识别的关键点的一致性大大简化了可视化的复杂性。CiteSpaceⅡ应用Java程序实现了大规模生物集群灭绝(mass extinction)(1981~2004年)和恐怖主义(terrorism)(1990~2003年)两个研究领域的建模和可视化过程。可视化网络中的突出的趋势和关键点的作用经各自领域专家直接验证,这些专家本身就是关键点文章的的作者。本文讨论了这项研究的实际意义,并明确了今后研究工作中存在的一系列挑战和机会。
陈超美陈悦侯剑华梁永霞
关键词:CITESPACE信息可视化知识传播
科学发现的结构与时间属性被引量:42
2014年
社会网络分析理论认为在一个社会网络中节点对其他节点潜在的影响是因所在位置而不同的,因而网络中各个位置并非等同。我们也知道弱连接往往比强联系更有价值。复杂网络分析理论已证实许多常见网络具有小世界属性。我们能从这些社会网络和信息网络的研究结果中获得什么?这些研究结果也存在于诸如作者合作和文献共被引这样的科学网络中吗?从根本上来说,是否存在一种能辨识出来的用于阐释科学发现演变的机制?正是针对这些问题,我们拟议了一个理论框架。这一框架强调基本理论及其在科学发现语境下的相互联系,包括社会网络中的结构洞理论、跨学科合作的边界客体概念和信息觅食理论。关于"科学知识创造与传播的识别"研究是富有挑战性的议题。
陈超美陈悦
关键词:知识可视化
共2页<12>
聚类工具0