您的位置: 专家智库 > >

国家自然科学基金(70771019)

作品数:9 被引量:68H指数:5
相关作者:吴江宁宣照国刘巧凤党延忠王舒更多>>
相关机构:大连理工大学中国科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术经济管理自然科学总论文化科学更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 5篇自动化与计算...
  • 3篇经济管理
  • 1篇文化科学
  • 1篇自然科学总论

主题

  • 2篇网络
  • 2篇文本相似度
  • 2篇相似度
  • 1篇大众
  • 1篇大众分类
  • 1篇用户
  • 1篇噪声
  • 1篇噪声数据
  • 1篇知识
  • 1篇知识传播
  • 1篇知识管理
  • 1篇中节点
  • 1篇社团
  • 1篇社团发现
  • 1篇社团结构
  • 1篇实证
  • 1篇实证研究
  • 1篇搜索
  • 1篇图结构
  • 1篇企业

机构

  • 9篇大连理工大学
  • 1篇中国科学技术...

作者

  • 7篇吴江宁
  • 4篇宣照国
  • 2篇党延忠
  • 2篇刘巧凤
  • 1篇肖连杰
  • 1篇刘建国
  • 1篇苗静
  • 1篇梁晶
  • 1篇王舒
  • 1篇王治江
  • 1篇史云飞

传媒

  • 5篇情报学报
  • 1篇上海理工大学...
  • 1篇科学学与科学...
  • 1篇科学学研究
  • 1篇运筹与管理

年份

  • 1篇2012
  • 1篇2011
  • 5篇2010
  • 1篇2009
  • 1篇2008
9 条 记 录,以下是 1-9
排序方式:
文本粗分类数据中噪声的快速修正算法
2009年
训练数据中的噪声数据对文本分类结果的精度会造成不良影响,本文提出了一种对噪声数据进行修正的快速算法。针对以前的算法,每次迭代只对一个文档进行修正,迭代次数与噪声数据数量相当,算法运行效率较低的问题,本文通过分析调整文档所属类别对评价指标的影响,提出依据模块度变化量判断噪声数据,一次迭代过程中可以对多个文档进行修正处理,从而提高算法效率。实验结果表明,本文所提算法能够更快地修正粗分类数据中的噪声,算法复杂度从以前算法的O(Tnm^2)降低为O(Tnm)。该算法可以用于对大数据量数据进行处理,实用价值更高。
宣照国党延忠
关键词:文本分类噪声数据
基于企业引用网络的技术影响力评价研究被引量:17
2011年
专利作为企业间技术竞争情报的重要信息源,从中可以发现竞争对手的技术发展战略及趋势。利用专利引用关系构建了企业引用网络,借鉴链接分析中PageRank算法的思想,提出了企业技术影响力的评价方法,并以USTPO美国专利数据库1975至1999年液压制动领域的专利为数据样本进行了实证分析。分析结果表明,与基于被引次数的传统评价指标相比,新评价方法综合考虑了引用企业数量、企业自身影响力、企业间引用强度三方面的因素,因此可以更加客观地评估企业的技术影响能力,进而帮助企业准确识别行业内的技术竞争对手。
王舒吴江宁
关键词:管理工程
面向客户需求的企业集群知识传播模型与仿真被引量:2
2010年
本文从市场中客户对企业提出的各种需求出发,建立了一个面向客户需求的知识传播网络,并通过计算机仿真模拟了企业集群在此网络中的知识传播过程,考察了集群的平均知识水平和知识方差在传播过程中的动态变化。通过仿真发现:随着时间的推移和对客户需求的满足,集群的平均知识水平呈单调递增趋势,知识传播效率呈现先增后减规律;集群知识方差在传播前期会出现剧烈震荡现象,而后期则会逐渐收敛;此外本文对市场规模以及知识维度对知识水平的影响也做了简单的考察,发现小规模市场有利于企业集群的初期发展,而过高或过低的知识维度都不利于企业集群平均知识水平的提高。
梁晶吴江宁
关键词:知识管理计算机仿真知识传播
科研合作网中节点重要性评价方法及实证研究被引量:13
2010年
科研人员的学术评价问题可以建模为科研合作网络中节点重要性的测度问题。用学术期刊论文的作者信息构建了作者科研合作网络,在此基础上,通过计算网络中节点的权值来评价作者的学术贡献,通过计算与该节点相连的边的权值来评价作者的科研产出能力,最后通过对节点和边的综合考察来判断节点的重要性。实证分析表明,用所提方法进行节点重要性测度,即对科研人员进行学术评价,结果符合实际情况。
肖连杰吴江宁宣照国
基于图结构的中文文本表示方法研究被引量:14
2010年
为解决基于统计的文本表示模型的信息缺失问题,本文提出了一种考虑词间语义和语序信息的基于图结构的中文文本表示方法,其思想是将文本的特征项表示成图结构中的节点,特征项间的关系表示成节点间的有向边,据此可将文本表示成由节点和有向边组成的图结构,并且将边赋予权重信息,该模型较大程度地保留了原文本的结构信息及语义信息。中文语料测试结果表明,基于图结构的文本表示方法对复杂文本语料的分类问题十分有效。对于简短文本语料,本文提出扩展特征项共现单元的修正方法,提高了图结构中文文本表示方法的普遍适用性。
吴江宁刘巧凤
关键词:文本表示文本相似度
一种基于后缀树的Web搜索结果聚类方法被引量:5
2010年
为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量。测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性。
吴江宁王治江
关键词:WEB搜索后缀树文档聚类
基于最大公共子图的文本相似度算法研究被引量:8
2010年
用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度。最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较。修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能。
吴江宁刘巧凤
关键词:文本相似度
科研领域关联网络的社团结构分析被引量:4
2008年
利用复杂网络对我国自然科学基础研究领域关联网络的社团结构进行研究.科研项目管理部门为申请者提供了代表各个研究领域的申报代码体系,每个立项建议书中填报了一个或两个研究领域代码.通过这些立项建议书构建了研究领域关联加权网络(WNRA),提出了一种应用于加权网络的社团结构发现算法,并使用公共实验数据验证了算法的有效性.应用本文提出的算法.对多个年度的领域关联网络的社团结构进行了分析,参照管理部门给出的申报代码体系,发现各年度的社团结构的变化状况.有助于了解我国各个学科领域的发展状况,并对管理部门调整申报代码提供支持.
宣照国苗静党延忠刘建国
关键词:社团结构社团发现复杂网络关联网络
基于用户兴趣扩散模型的网络资源推荐方法被引量:6
2012年
针对Web2.0环境下大众分类系统中用户、资源和标签之间的三元相关关系,本文提出一种基于三部图的用户兴趣扩散模型,据此为用户进行网络资源的推荐。其主要思想是:通过迭代的扩散机制,使目标用户对信息的兴趣依三部图结构扩散至其他的用户、标签和资源上,然后以资源兴趣度排序为依据,在目标用户未曾收藏的资源中产生推荐。该推荐方法的优势在于扩大了推荐范围,避免了数据稀疏对推荐造成的干扰。利用公共数据集进行的实验表明,本文提出的推荐方法其准确率和召回率优于基于二部图用户兴趣扩散的资源推荐结果。
史云飞吴江宁宣照国
关键词:个性化推荐大众分类
共1页<1>
聚类工具0