孙锐
- 作品数:33 被引量:54H指数:5
- 供职机构:乐山师范学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金四川省教育厅科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理化学工程更多>>
- 一种基于人工智能的诗词检索方法及系统
- 本发明公开了一种基于人工智能的诗词检索方法及系统,首先接收用户录入的语句,并将用户所录入的语句通过停顿词表进行拆分,得到语句中的各个词语;其次分别将各个词语所对应的古诗词的字从释义数据库中查找出来;然后根据查找出来的各个...
- 孙锐刘莎王俊杰谢红
- 基于事件图的新闻标题生成研究
- 2017年
- 为新闻自动生成标题是一个极具挑战的任务。文章基于事件图,提出一种有效的无监督标题生成方法。给定一篇新闻文档,首先为其构造事件图以表示整个篇章,然后采用图排序方法以计算每个事件的显著性得分。随后为排序后的多个事件,抽取其在文中的依存片段作为候选标题,最后设计一个目标优化函数以搜索最终的标题。在英文和中文数据集上的实验结果表明,文章提出的方法能有效地学习显著性事件并能较好地生成标题。
- 孙锐
- 关键词:事件抽取
- 面向中文新闻语料的事件规范化研究被引量:1
- 2021年
- 本文针对中文文本事件形态存在的不统一或省略的现象,提出一种基于自举的事件规范化方法。在中文新闻语料上的实验表明了方法的有效性。通过对事件规范化结果的分析明确了事件分析中的一些新难点,为后续事件相关任务研究提供了思路。
- 谢红孙锐
- 关键词:事件抽取
- 地方普通院校文本挖掘课程的教学实施和探索被引量:3
- 2021年
- 针对文本挖掘课程在地方普通院校计算机本科专业中教学实施历史短、教材不成熟、知识融合度低等问题,结合专业课程体系和实际学情,探讨该课程在地方普通院校计算机专业中的教学实施。以乐山师范学院计算机专业文本挖掘课程教学实践为例,阐述课程教学的目标定位、内容设计、教学方法以及考核方案方面的改革思路和方法,最后通过课程问卷调查的结果说明课程改革的有效性。
- 孙锐谢红
- 关键词:计算机科学与技术文本挖掘自然语言处理人工智能
- 一种旅店评论文本的属性描述提取方法
- 本发明提供了一种旅店评论文本的属性描述提取方法,对评论文本进行预处理;利用向量组合方法得到评论子句的向量表示;计算评论子句间的余弦相似度;利用无参聚类方法对评论子句数据集进行文本聚类,得到相似评论簇;计算每个评论簇的中心...
- 孙锐曾宇金澎谢红
- 文献传递
- 一种针对突发事件新闻的文本分类方法
- 本发明提供了一种针对突发事件新闻的文本分类方法,属于自然语言处理领域,包括:收集新闻文档,完成数据清洗,及文档的分词、依存分析和指代消解等预处理操作,得到新闻数据集D;将新闻数据集D加入到背景语料,利用Word2Vec训...
- 孙锐谢红
- 一种基于改进朴素贝叶斯的涉密文本识别方法
- 本发明公开了一种基于改进朴素贝叶斯的涉密文本识别方法,包括以下步骤:S1.构建朴素贝叶斯模型并进行增量式学习;S2.加载增量式学习得到的朴素贝叶斯模型;S3.读取待识别的文本;S4.利用朴素贝叶斯模型对文本进行识别,并标...
- 敬思远杨骏孙锐郭肇毅
- 文献传递
- 基于事件指导的多文档生成式摘要方法被引量:6
- 2017年
- 建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。
- 王振超孙锐姬东鸿
- 关键词:多文档摘要
- 一种针对突发事件的事件知识图谱构建方法
- 本发明提供了一种针对突发事件的事件知识图谱构建方法,属于自然语言处理领域,包括以下步骤:1)从互联网上收集新闻文档数据,完成数据清洗等预处理操作;2)将语料加入背景语料,预训练后习得词的嵌入表示;3)以语句为单位,抽取原...
- 孙锐谢红
- 文献传递
- 基于位置敏感Embedding的中文命名实体识别被引量:3
- 2017年
- 在基于条件随机场的中文命名实体识别任务中,现有表示学习方法学习到的特征存在语义表示偏差,给中文命名实体识别带来噪声。针对此问题,提出了一种基于位置敏感Embedding的中文命名实体识别方法。该方法将上下文位置信息融入到现有的Embedding模型中,采用多尺度聚类方法抽取不同粒度的Embedding特征,通过条件随机场来识别中文命名实体。实验证明,该方法学习到的特征缓解了语义表示偏差,进一步提高了现有系统的性能,与传统方法相比,F值提高了2.85%。
- 鲁亚楠孙锐姬东鸿
- 关键词:命名实体识别EMBEDDING条件随机场