国家自然科学基金(60573090)
- 作品数:29 被引量:124H指数:7
- 相关作者:王大玲于戈孙焕良鲍玉斌陈冬玲更多>>
- 相关机构:东北大学沈阳建筑大学辽宁大学更多>>
- 发文基金:国家自然科学基金辽宁省自然科学基金辽宁省教育厅攻关计划项目更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于双层网格索引的移动对象KNN查询算法
- 移动对象KNN查询技术是当前数据库领域中的一个研究热点.实际的移动对象的应用多数存在由对象速度变化引起的动态负载问题,而现有KNN查询算法较少考虑该问题.提出了一种基于双层网格索引的移动对象KNN查询算法.算法采用粗细双...
- 宋晓宇孙业挺孙焕良
- 关键词:KNN
- 文献传递
- IncSNN——一种基于密度的增量聚类算法被引量:5
- 2006年
- 基于密度的聚类算法是一类重要的聚类算法,能发现任意形状的簇,但由于它的时间复杂度较高,因此设计有效的增量更新算法是一个重要研究方向.在SNN算法的基础上,提出一种基于密度的增量聚类算法-IncSNN.该算法将所更新对象的空间进行划分,定义了基于该划分的最近邻居的概念,进而确定了受影响对象的集合,当算法更新时,只需要对受影响的数据进行处理.由于受影响对象的集合远小于原数据集合,因此显著提高了算法的效率.实验结果验证了IncSNN的有效性.
- 孙焕良邱菲刘俊岭朱叶丽
- 关键词:聚类分析增量聚类算法
- 一种基于内容特性的文本聚类方法被引量:3
- 2007年
- 在基于概率模型的聚类中,簇模型对数据分布的拟合性直接影响着聚类质量。基于内容的文本数据分布的复杂性导致单一因素的簇模型无法准确拟合文本数据的分布特征。该文认为文本基于内容的分布特性主要受主题内容和通用写作方式影响,给出了一种基于主题模型和通用模型的混合簇模型和基于该簇模型的文本聚类方法。实验表明该聚类方法较单一因素的簇模型具有更好的拟合性,聚类质量更好。
- 李晓光宋宝燕于戈王大玲
- 关键词:聚类混合模型
- 基于滑动窗口的支持泛在应用的流聚类挖掘算法被引量:7
- 2008年
- 近年来,泛在数据流挖掘逐渐成为数据挖掘发展的新热点,它具有在有限的资源上去挖掘无限的数据流,并可随时随地返回挖掘结果的特点,对此,本文提出一种基于滑动窗口的流聚类算法;该方法将一个滑动窗口分成n个大小相等的窗口单元,基于窗口单元进行增量式的知识相关性的挖掘,提高了流挖掘的效率;当窗口滑动时,通过衰变函数衰减当前滑动窗口内的第一个窗口单元的挖掘结果,并在当前滑动窗口挖掘结果中将其剔除,实现下一滑动窗口的增量式挖掘.
- 宋宝燕张衡于洋奚丽娜王大玲
- 关键词:聚类挖掘
- 基于句法结构特征分析及分类技术的答案提取算法被引量:29
- 2008年
- 由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.
- 胡宝顺王大玲于戈马婷
- 关键词:中文问答系统
- 支持个性化检索的User Profile研究概述被引量:8
- 2008年
- 在现代搜索系统中,由于网络信息的动态性和用户兴趣的迁移性,通常的检索技术已难以满足用户的个性化需求,个性化搜索势在必行.User Profile作为描述用户兴趣和爱好的载体和手段,是个性化搜索领域的重要组成部分之一.本文论述了User Profile的创建、学习、存储、更新及其在个性化搜索系统中发挥的作用等,分析在相关反馈过程中,利用User Profile进行查询扩展的具体过程.针对向量空间模型和概率模型,分别讨论了User Profile的更新问题.最后,展望了User Profile的发展方向,得出"基于本体的User Profile是目前和将来最具潜力的方法"的结论.
- 陈冬玲王大玲于戈
- 关键词:个性化信息检索USERPROFILE本体
- 搜索引擎中一种基于PLSA的用户模型
- 1前言当前搜索引擎使用的基于关键词的搜索,忽略了用户的差异和用户动机。新一代的搜索引擎应该具有互动式搜索等特点,更需要对用户提供个性化
- 于芳王大玲于戈白旭辉
- 关键词:REQUIREMENTFEEDBACK
- 文献传递
- 一种分级统计OLAP模型的研究与应用
- 1引言联机分析处理(OLAP)系统是数据仓库主要的前端支持工具,它给用户提供了交互的、多维的、多角度的数据结果展示方式。数据仓库一般存储了
- 师金钢宋杰鲍玉斌于戈冷芳玲
- 关键词:OLAPCUBE
- 文献传递
- 一种多维数据可视化方法:旋转极坐标系法
- 1前言随着数据库系统的发展,数据的多维性已经广泛地存在于各种领域。由于人类没有对高维数据的空间猜想能力,不能对其产生直观的认识,因此可视化多维数据一般是寻找一种方法把多维数据投影到二维或者三维空间,使人们对其产生直观的认...
- 邵一川申德荣马也王广奇聂铁铮于戈
- 关键词:CLUSTERINTERACTIVE
- 文献传递
- 面向用户的排序算法研究
- 目前大部分搜索引擎对于用户查询返回结果的差异依赖于查询词.而实际上,即便查询词相同,不同的用户潜在的信息需求可能不同.搜索引擎并不能针对用户的特点提供个性化的服务,大多数返回的文档都是与用户的需求不相关的.提出"搜索系统...
- 于芳王大玲于戈陈冬玲鲍玉斌
- 关键词:兴趣向量潜在信息需求
- 文献传递