公共文化服务平台

共 8 条记录，以下是 1-8

全选清除导出

排序方式：

采用对象特征向量表示法的标签聚类算法被引量：8: 2012年; 在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.; 周津陈超俞能海; 关键词：特征向量 K-MEANS 余弦相似度

简约语法规则和最大熵模型相结合的混合实体识别被引量：12: 2012年; 现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升.; 陆铭康雨洁俞能海; 关键词：命名实体识别最大熵模型

基于张量分解的数字图像取证被引量：1: 2011年; 提出一种基于张量分解的数字图像盲检测方法,从全局处理角度对JPEG压缩数字图像进行真伪盲检测。对于来自某一相机拍摄的一批参考图像组成的张量,利用张量分解的方法,从分解残差中分析提取图像特征,通过支持向量机分类器鉴别待检测图像是否直接来自该数码相机。实验结果表明,该方法对数字图像的来源鉴定具有较高准确性和较强的鲁棒性。; 刘铭俞能海李卫海周浩; 关键词：图像盲取证张量分解支持向量机

多特征融合的博客文章分类方法被引量：8: 2010年; 博客已经成为了互联网上最热门的应用之一.博客文章内容千差万别,对其进行分类具有重要意义.博客文章有别于新闻文章,普通文本分类方法直接应用于博客文章效果不理想.提出一种新的方法,充分利用了博客文章特有的Tag、用户自定义类别等多个特征,并对各项特征进行融合.另外,通过对自定义类别进行预处理,过滤与类别无关的噪声单词.实验结果表明多特征融合的方法能够有效提高博客文章分类的准确率.; 麦林俞能海; 关键词：文本分类多特征融合

BSPM:A NEW MECHANISM FOR “OVERLAP-MATCHING EXPRESSIONS”IN DPI: 2010年; Nowadays, using Deterministic Finite Automata (DFA) or Non-deterministic Finite Automata (NFA) to parse regular expressions is the most popular way for Deep Packet Inspection (DPI), and the research about DPI focuses on the improvement of DFA to reduce memory. However, most of the existing literature ignores a special kind of "overlap-matching expression", which causes states explosion and takes quite a large part in the DPI rules. To solve this problem, in this paper a new mechanism is proposed based on bitmap. We start with a simple regular expression to describe "overlap-matching expressions" and state the problem. Then, after calculating the terrible number of exploded states for this kind of expressions, the procedure of Bitmap-based Soft Parallel Mechanism (BSPM) is described. Based on BSPM, we discuss all the different types of "overlap-matching ex- pressions" and give optimization suggestions of them separately. Finally, experiment results prove that BSPM can give an excellent performance on solving the problem stated above, and the optimization suggestions are also effective for the memory reduction on all types of "overlap-matching expressions".; Li Zheng Yu Nenghai Li Yang

融合争议度特征的协同过滤推荐算法被引量：4: 2012年; 基于项目的协同过滤推荐算法在电子商务中有着广泛的引用,该算法的核心是计算项目之间的相似度.传统的计算项目相似度算法仅仅通过项目间共同用户评分值差异来计算,在数据稀疏情况下,项目间共同用户评分值很少,导致此类算法性能严重下降.针对此问题,从项目间的整体评分角度出发,提出争议相似度的概念,争议相似度从项目间评分方差差异的角度衡量项目间相似性.将争议度特征融合到基于项目之间共同用户评分的传统相似度算法中,进而提出了融合项目争议度特征的协同过滤推荐算法,最终缓解了传统算法在稀疏数据情况下相似度计算不准确的问题.实验结果表明该算法在数据稀疏环境下可以明显提升推荐质量.; 张学胜陈超张迎峰俞能海; 关键词：协同过滤最近邻居数据稀疏

基于最近邻用户动态重排序的协同过滤方法被引量：2: 2011年; 在传统协同推荐方法中,相似性的度量是整个方法的核心.在数据稀疏情况下,现有相似度计算方法仅使用历史评分数据,难以准确反映用户之间的相似程度;相关改进方法在考虑用户共同评分数量对相似度的影响时,引入的重叠度参数需要手动调整,限制了方法实用性.针对上述问题,本文提出一种基于最近邻用户重排序(DRNN)的相似度方法,充分利用项目类别信息,根据不同的目标项目动态调整邻居集内用户权重,能更准确地刻画用户之间的相似性;并提出修正的重叠度因子弥补现有方法中手动调整参数的不足,增强了方法实用性.实验结果表明,该方法可以明显提升预测结果的准确性.; 张迎峰陈超俞能海; 关键词：协同过滤

一种Web 2.0环境下互联网热点挖掘算法被引量：6: 2010年; 利用Web2.0下用户丰富的反馈信息进行互联网热点挖掘具有重要的应用价值。该文将Web2.0下用户在互联网上的信息活动看作为热度活动,并利用热量传递模型对其建模,然后基于该模型提出适用于Web2.0环境下的话题抽取与热度评价算法。实验结果表明热量传递算法有效地利用了用户反馈信息,适用于Web2.0下互联网环境。; 李东方俞能海尹华罡; 关键词：互联网 WEB2.0

全选清除导出

共1页<1>

国家高技术研究发展计划(2008AA01Z117)