杨凤芹
- 作品数:10 被引量:65H指数:3
- 供职机构:东北师范大学计算机科学与信息技术学院更多>>
- 发文基金:国家自然科学基金吉林省科技发展计划基金吉林省教育厅科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向中文产品评论的完整评价对象抽取方法被引量:3
- 2017年
- 传统评价对象抽取方法较少考虑低频、结构复杂和信息量较大的评价对象。为此,针对中文产品评论提出一种完整评价对象抽取方法。利用词性和语法分析结果提取基础词单元,通过每个词单元的完整值和缺失值对其进行扩展,根据连接稳定性判断扩展后的词单元是否合理,得到候选评价对象集合,采用过滤策略对候选评价对象集合进行过滤,获得最终的评价对象集合。在真实数据集上的实验结果表明,该方法对包含低频和分词结构复杂的评价对象有较好的抽取效果。
- 杨凤芹宋美佳孙铁利孙红光
- 关键词:完整性
- 段落及类别分布的特征选择方法被引量:3
- 2018年
- 特征选择是文本分类过程中解决数据高维问题的重要步骤.现有特征选择方法主要是基于特征词的词频或文档频率.虽然这些信息在一定程度上度量了特征词的重要程度,但它们不能刻画特征词在文档中的分布情况.针对这一问题,将文档的自然段落作为统计单元,提出了特征词的段落频率,该度量标准能够描述特征词在文档中的均匀分布程度.然后,将特征词的段落频率与特征词在类内和类间的分布信息相结合提出一种新的特征选择方法 FSPC.为了验证方法的有效性,采用支持向量机和朴素贝叶斯作为分类器,在复旦语料库和搜狐新闻语料库上将FSPC与CHI Square,DF,IG和CMFS四种特征选择方法进行对比实验.实验结果表明,就评价指标F1值而言,FSPC方法的性能优于所对比的方法.
- 杨凤芹樊娜孙红光孙红光彭杨
- 关键词:文本分类
- 基于类空间密度的文本分类特征加权算法被引量:3
- 2017年
- 特征加权是一种依据特征在分类中起到的作用为特征赋予相应权重的过程,是为了提高分类性能而为特征标记权重的策略。基于类空间密度提出了两个新的特征加权算法:tf*ICSDF和ICSDF-based。实验中,在RCV1-4和20 Newsgroups数据集上,采用支持向量机分类器将提出的方法进行了验证。实验结果显示,该方法相比传统的特征加权方法(prob-based、tf*icf和icf-based)可以有效地提升文本分类性能。
- 贾隆嘉孙铁利杨凤芹孙红光
- 关键词:特征加权文本分类
- 基于语义的文本相似度计算方法
- 本发明提供了一种基于语义的文本相似度计算方法,涉及面向文本的智能信息处理技术领域。其目的在于解决常规的文本向量空间模型及余弦相似度无法进行语义相关判断的问题。基于语义的文本相似度计算包括以下步骤:对文本集进行预处理,提取...
- 孙铁利杨凤芹周旭孙红光吴迪
- 文献传递
- 一种新的本体的概念语义相似度计算方法被引量:1
- 2015年
- 提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。
- 孙铁利邢元元关煜陈斯娅杨凤芹孙红光
- 关键词:语义相似度
- 建立层次结构用户兴趣模型的方法
- 为解决Internet上对于普通的用户日益严重的'信息迷失'和'信息过载'问题,智能信息检索和个性化信息服务成为当前信息服务研究的重点.作为其基础,一方面要研究如何应用人工智能的技术表示和组织Internet上的信息,另...
- 杨凤芹
- 关键词:个性化用户兴趣模型中文分词向量空间模型聚类
- 文献传递
- 离散粒子群优化算法在流水作业调度问题中的应用被引量:3
- 2014年
- 通过引入随机向量,改进离散粒子群算法DPSO的更新方程,提出一种离散的粒子群优化算法MDPSO,并将其应用于调度问题的求解.实验结果表明,该算法优于传统的时序分解算法和遗传算法.
- 付志军冯丽杜伟宁凌振宝杨凤芹
- 关键词:进化算法粒子群优化算法调度问题
- 一种基于相对特征的文本分类算法被引量:4
- 2010年
- 针对文本分类问题,将朴素贝叶斯分类与自组织特征映射网络分类相结合,提出了基于相对特征的文本分类算法.该算法具有很快的速度和较高的准确率,从而为构建高效的搜索引擎提供支撑.
- 孙铁利赵隽杨凤芹吴迪
- 关键词:文本分类朴素贝叶斯自组织映射网络
- 根据用户隐式反馈建立和更新用户兴趣模型被引量:45
- 2003年
- 提出一种通过获取用户的隐式反馈信息建立和更新用户兴趣模型的方法.这种方法不需要用户显式地提供兴趣信息,只要通过观察用户在浏览Web页面时所采取的动作来获取隐式的反馈信息,并利用这些信息建立与更新用户兴趣模型,从而减轻用户的负担.
- 孙铁利杨凤芹
- 关键词:用户兴趣模型隐式反馈
- 基于语义的文本相似度计算方法
- 本发明提供了一种基于语义的文本相似度计算方法,涉及面向文本的智能信息处理技术领域。其目的在于解决常规的文本向量空间模型及余弦相似度无法进行语义相关判断的问题。基于语义的文本相似度计算包括以下步骤:对文本集进行预处理,提取...
- 孙铁利杨凤芹周旭孙红光吴迪
- 文献传递