您的位置: 专家智库 > >

倪维健

作品数:15 被引量:44H指数:4
供职机构:山东科技大学信息科学与工程学院更多>>
发文基金:国家自然科学基金中国博士后科学基金山东省高等学校科技计划项目更多>>
相关领域:自动化与计算机技术交通运输工程电子电信更多>>

文献类型

  • 9篇期刊文章
  • 3篇会议论文
  • 2篇科技成果
  • 1篇学位论文

领域

  • 14篇自动化与计算...
  • 1篇电子电信
  • 1篇交通运输工程

主题

  • 4篇聚类
  • 3篇信息检索
  • 3篇数据挖掘
  • 2篇学术文献
  • 2篇智能交通
  • 2篇智能交通信息
  • 2篇数据分析工具
  • 2篇主题模型
  • 2篇文档
  • 2篇面向主题
  • 2篇交通信息
  • 2篇感器
  • 2篇查询
  • 2篇传感
  • 2篇传感器
  • 1篇代表点
  • 1篇单文档
  • 1篇独立同分布
  • 1篇信息采集
  • 1篇信息增益

机构

  • 10篇南开大学
  • 5篇山东科技大学
  • 1篇微软公司

作者

  • 15篇倪维健
  • 8篇黄亚楼
  • 4篇刘彤
  • 2篇刘赏
  • 2篇张文良
  • 2篇曾庆田
  • 2篇康叶伟
  • 2篇汤建渝
  • 2篇柳梅
  • 1篇康宏
  • 1篇孙凤池
  • 1篇徐君
  • 1篇赵华
  • 1篇师文轩
  • 1篇李飞
  • 1篇王秉政
  • 1篇赵莹
  • 1篇高永梅
  • 1篇林立
  • 1篇谢茂强

传媒

  • 2篇计算机科学
  • 1篇模式识别与人...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇现代图书情报...
  • 1篇计算机工程与...

年份

  • 1篇2016
  • 1篇2015
  • 3篇2012
  • 1篇2009
  • 2篇2008
  • 2篇2007
  • 2篇2006
  • 2篇2005
  • 1篇2004
15 条 记 录,以下是 1-10
排序方式:
基于中间件的数据挖掘企业应用平台及相关技术研究
黄亚楼师文轩谢茂强倪维健康宏王秉政
本项目自2005年4月开始启动,经过调研规划、总体方案论证和关键理论研究和核心技术攻关,最终完成了数据挖掘的中间件平台的搭建与具体实施,实现了一个具有数据预处理、分类、聚类、关联规则、知识表达等功能的基于中间件技术的数据...
关键词:
关键词:中间件数据挖掘企业应用平台
面向搜索引擎查询日志的领域术语自动识别方法被引量:2
2016年
【目的】为弥补传统基于静态领域语料的领域术语识别方法的不足,提出一种从搜索引擎查询日志中自动识别领域术语的新方法。【方法】使用四部图对查询日志进行抽象描述,并在其上应用流形排序算法得到所有候选术语关于领域度的排序,取排在前列的术语作为领域术语。【结果】在真实搜索引擎的查询日志上实验证实本文方法具有更好的领域术语识别效果,在Precision@n指标上比基准方法提升约20%。【局限】识别到的领域术语的覆盖面部分依赖于领域专家选取的初始查询词,这对领域专家的经验提出一定要求。【结论】该方法无需事先准备大规模领域语料以及大量的人工标注,即可构建高质量的领域术语集合,具有较高的实用价值。
刘彤倪维健柳梅
关键词:搜索引擎查询日志流形排序
一种基于加权多代表点的层次聚类算法被引量:7
2005年
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。
倪维健黄亚楼李飞刘赏
关键词:聚类算法代表点加权K-近邻聚类效果
一种面向领域文档的结构化检索模型及其在农技处方检索中的应用
2015年
各种专业领域中的文档往往具有显著的结构化特征,即一篇文档往往是由具有不同表达功能的相对固定的多个文本字段构成,同时这些字段蕴含了相关的领域知识。针对专业文档的结构化和领域化特征,设计了一种面向结构化领域文档的信息检索模型。在该模型中,首先对领域文档集进行挖掘以构建能够反映领域知识的结构化模型,之后以此为基础设计了结构化文档检索算法来为用户查询返回相关的领域文档。选择一类典型的领域文档——农技处方开展了应用研究,利用一份现实的农技处方文档数据集将提出的方法与传统的信息检索方法进行了实验对比分析,并开发了农技处方检索原型系统。
刘彤倪维健
关键词:信息检索查询扩展
激光智能交通信息采集与处理系统研究开发
黄亚楼孙凤池贾凤鸣康叶伟倪维健尤克文赵莹宋久擎林立
该课题开发了利用激光原理测量车辆车速、车型基本信息的传感器装置。提出了适合激光传感器信息采集的基于485总线网络和以太网络的物理结构以及相应的逻辑结构。物理结构中,每一个小的物理区域安排一台或者多台数据采集计算机,该计算...
关键词:
关键词:激光传感器交通信息采集
基于非平衡数据分类的单文档自动文摘方法被引量:2
2012年
自动文摘是自然语言处理领域的一个重要研究话题,基于机器学习的自动文摘方法则是该项研究中的一个热点。然而,自动文摘问题中的数据分布有一个重要现象,即文摘句子与非文摘句子的数量相差非常悬殊,该现象将给传统机器学习算法的应用效果带来负面影响。为此,本文针对自动文摘中句子类别分布严重不平衡这一现象,以支持向量机算法为基础,设计了两种有效的处理非平衡自动文摘数据的分类方法。在第一种方法中,将传统支持向量机中正负类平衡的分类间隔转换为不平衡的分类间隔;在第二种方法中,通过将数据集进行切分,设计了一种支持向量机集成学习算法。通过在DUC2001数据集上的实验证明,本文设计的两种基于非平衡数据分类的单文档自动文摘方法显著优于基于传统分类算法的自动文摘方法。
倪维健刘彤曾庆田赵华汤建渝
关键词:非平衡数据分类支持向量机分类器集成
一个面向主题的学术文献数据分析工具
学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持.本工具使用Latent ...
倪维健柳梅曾庆田刘彤汤建渝
关键词:主题模型LDA
文献传递
使用分形维数实现不同密度区域的聚类
提出了对不同密度区域进行聚类的问题,针对这一问题,引入分形理论,介绍了分形理论在数据挖掘聚类问题中的应用,提出了一种基于分形维数的对不同密度区域进行聚类的算法FDC.在实现中,FDC算法采用基于网格索引的分形维数计算方法...
窦志彤倪维健高永梅黄亚楼
关键词:分形维数数据挖掘聚类
文献传递
一个面向主题的学术文献数据分析工具
学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持。本工具使用Latent ...
Ni Weijian倪维健Liu Mei柳梅Zeng Qingtian曾庆田Liu Tong刘彤Tang Jianyu汤建渝
关键词:优化设计信息检索主题模型
流数据聚类模型变化检测策略被引量:2
2006年
流数据是动态的、不断发生变化的,如果能够及时发现流数据聚类模型的变化,并报告给用户发生了哪些变化,可以帮助用户制定出更好的策略。针对该需求,论文提出一种流数据变化检测策略,该策略充分利用簇统计信息CFT检测变化,比较变化后新聚类模型与原模型之间的差异,分别报告出每一个簇的具体变化,其时间复杂度为O(K2),实验证明该机制能够较为直观地报告出变化的结果。
刘赏黄亚楼倪维健
关键词:流数据聚类数据挖掘
共2页<12>
聚类工具0