中央高校基本科研业务费专项资金(N100704001) 作品数:12 被引量:86 H指数:4 相关作者: 于戈 申德荣 鲍玉斌 聂铁铮 孙焕良 更多>> 相关机构: 东北大学 沈阳建筑大学 中国移动通信研究院 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
空间数据库中主题相关区域查询 被引量:2 2012年 空间查询处理已经广泛地应用于基于位置的服务、设施选址等领域.提出一种新的空间查询:主题相关区域查询(topic-relevant region queries,T2R),该查询可以用于位置选址等空间决策分析.给定一个由空间特征对象集合R定义的主题T、查询窗口q,T2R查询返回不交叠的k个与主题最相关的区域,区域与主题的相关程度由区域内特征对象的数量结合其重要性进行计算.为了有效处理T2R查询,提出BSL,FR和SHR3种算法,其中SHR算法将高相关程度区域先聚类、再收缩以获得更优的剪枝效果.所提出的算法解决了给定查询窗口下对数据空间任意位置按主题相关程度进行排序的问题.利用真实与人工数据集进行了充分实验,评估了所提出算法在不同参数设置下的查询效率,通过针对实际主题的查询验证了T2R查询的有效性. 刘俊岭 于戈 孙焕良关键词:空间数据库 数据空间中时间为中心的集合实体识别策略 被引量:4 2012年 数据空间是一个异构的环境,并且数据及模式具有随时间演化的特性。已有的实体识别技术很少考虑时间信息在识别中所起的作用,并且没有考虑实体随时间演化的特性。针对数据空间中具有时间信息的实体识别,提出了一个四阶段的时间为中心的集合实体识别策略(time-centered collective entity resolution,T-CER)。T-CER在实体识别过程的不同阶段都考虑了时间信息所起的作用,在识别阶段提出了基于时间的聚类算法(time-based clustering,T-Clustering),并使用基于时间的约束对识别结果进行检查,以获得更精确的识别结果。在真实数据集上的大量实验结果表明了T-CER的可行性和有效性。 杨丹 申德荣 于戈 聂铁铮 寇月关键词:数据空间 时间信息 基于语义聚类的P2P网络资源查找策略 被引量:1 2011年 针对无结构peer-to-peer(P2P)网络中查询请求转发具有盲目性、查询效率较低的问题,提出了一种基于语义聚类的资源查找策略SC-Search。节点首先对本地资源进行聚类,进而在节点间构建相似链接,基于相似链接进行资源查找。在网络结构方面构建了一个双层的覆盖网络。提出一种通过构造语义森林的算法对本地资源进行聚类,然后通过在节点间建立相似链接将网络中包含相似资源的节点聚类,同时对相似链接进行动态优化,使得相似节点集合在物理网络上更接近。查询请求在转发时,结合了定向模式和泛洪模式,并增设了动态TTL机制,进一步提高资源查找的成功率和效率。实验结果表明提出的策略是切实可行的。 王振华 熊景川 申德荣 于戈关键词:对等网络 资源查找 语义聚类 一种基于增量分区的社交网络数据管理与维护方法 社交网站作为在线交流的最新形式,吸引了数以亿计的用户,同时产生了海量数据.为此,如何存储大量的用户及其交互信息成为了社交网站的一个挑战.在深入分析了社交网络数据的特点之后,提出了一种用来描述社交网络中用户交互行为的交互关... 白帆 申德荣 王习特 聂铁铮 寇月 于戈关键词:社交网络 文献传递 云数据管理系统能耗基准测试与分析 被引量:25 2013年 云数据管理系统是一种新兴的数据管理系统.为了研究云数据管理系统的能耗优化,实现"绿色计算",首先要定义能耗的度量模型和基准测试方法,分析系统的能耗特点.目前云数据管理系统的基准测试主要集中在性能方面,对能耗方面的评估和优化工作很少;对测量仪器、测试手段、测试用例以及能耗基本规律的研究存在空白.文中提出了一种能耗的度量模型和数学表达;定义了一组数据装载、查询和分析用例来测试云数据管理系统的能耗;设计了系统能耗的测量方法;分析了若干云数据管理系统在执行数据装载、读取、查询、聚集和连接等操作时的能耗特征,提出了通过降低"等待能耗"而进行云数据管理系统的能耗优化.大量实验数据证明,尽管云计算被认为是一种绿色计算,但文中测试的云数据管理系统在能耗方面差异较大,需要对部分系统进行进一步的优化. 宋杰 李甜甜 朱志良 鲍玉斌 于戈关键词:能耗 MAPREDUCE 大数据 云计算 一种面向关系数据库的语义关键字查询策略 在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点.面向关系数据库的关键字查询允许用户在不知道数据库模式、不使用复杂的查询语句的情况下查找出相关信息.然而这种方法可能会产生大量的查询结果,且这些结果与用户... 张瑶 申德荣 寇月 聂铁铮 于戈关键词:关系数据库 TOP-K 文献传递 图数据中Top-k属性差异q-clique查询 被引量:6 2012年 紧密子图发现在许多现实世界网络应用中具有重要的研究意义.提出一种新的紧密子图发现问题——Top-k属性差异q-clique查询,找出图中k个节点间属性具有最大差异的q-clique.属性差异q-clique是一种结合图的结构特征和节点属性的紧密子图,在作者合作关系图数据中,该查询可以发现属性(如研究领域或所属单位)上不同的具有紧密合作关系的团队.给出了q-clique的属性差异度量,证明了该问题为NP难问题.采用分支限界策略,提出一种有效求解问题的算法AD-Qclique,同时依照best-first排序思想优化节点访问次序进一步提高算法性能.ACM作者信息数据集上的实验表明,算法AD-Qclique效率远优于基本算法BSL,并且结果中作者皆具有较高的H-index值及广泛的研究领域. 孙焕良 卢智 刘俊岭 于戈关键词:分支限界 SmartPainter:基于色彩扩散的灰度图像着色器(英文) 2011年 利用用户指定的颜色为灰度图着色在电影制作、图片处理等领域具有广泛地应用.灰度着色需要考虑与用户的互动,往往需要场景等先验知识.主要问题是涉及到大量的像素计算,成本高、耗时巨大.介绍一个新颖的快速着色器,根据用户指定的颜色,可以完成色彩的自动扩散.可以自动寻找扩散颜色的边界,保证着色的快速和准确.SmartPainter为用户提供简单易行的操作平台,只需要用户提供对所在区域的基本颜色即可达到很好的着色效果. Ahmed A. Hussein 杨晓春关键词:着色 图像处理 WSR:一种基于维基百科结构信息的语义关联度计算算法 被引量:27 2012年 该文提出了一种基于维基百科结构信息的语义关联度的计算方法——WikiStruRel(WSR).维基百科作为目前规模最大和增长最快的在线百科系统,其典型包括两个网状结构:文章网络和分类树(以树为主体的图),这两个网状结构包括了丰富的、明确定义的语义知识.WSR充分分析维基百科的文章网络和分类树,进而计算词语间的语义关联度.该方法没有涉及文本处理,算法开销较小,在3个数据集上的实验,取得了较好的准确率和覆盖度. 孙琛琛 申德荣 单菁 聂铁铮 于戈关键词:维基百科 分类树 一种面向情感分析的微博表情情感词典构建及应用 被引量:15 2012年 表情符号作为一种新的网络语言,在微博中被广泛采用,在一定程度上代表了用户的情绪和思想,也将影响微博情感倾向分析的结果。该文提出基于微博统计数据为表情符号构建情感词典的思想,通过对大量微博中与表情"共现"的文本的情感倾向分析,确定表情的情感倾向,以此构建面向情感倾向分析的表情情感词典,旨在为微博乃至其它采用表情符号的Web用户生成信息的情感倾向分析提供支持。进而,该文将表情情感词典反作用于对应的微博文本,重新度量其中情感词的倾向值,改进现有的情感词典,旨在获得更准确的情感倾向分析结果。实验表明了该方法的有效性,并分析了相关阈值的设置对结果的影响。 王文远 王大玲 冯时 李任斐 王琳关键词:表情符号 情感分析