王红玲
- 作品数:73 被引量:182H指数:8
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金江苏省高校自然科学研究项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学建筑科学更多>>
- 一种基于历史信息的自然语言层次句法分析方法
- 本发明公开了一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据...
- 朱巧明周国栋李培峰李军辉钱龙华孔芳王红玲钱培德
- 文献传递
- 一种遥感图像道路识别方法及系统
- 本发明公开了一种遥感图像道路识别方法及系统,包括:获取道路图像;对道路灰度图进行连通域分析,得到道路连通域;根据各关键点及其邻域像素的梯度方向和各关键点及其邻近像素到道路边缘的欧式距离,对道路连通域的支路进行分割,得到初...
- 王红玲单嘉豪
- 文献传递
- 基于两种句法分析的语义角色标注比较研究被引量:2
- 2010年
- 首先介绍了短语结构句法树和依存树,比较了两者的差别。然后通过构建基于短语结构句法分析和基于依存句法分析的两个不同的语义角色标注系统,在实验数据的基础上,重点分析短语结构句法分析和依存句法分析的差别以及两者对语义角色标注的影响。实验结果表明,基于依存句法分析的语义角色标注系统的性能略好于基于短语结构句法分析的语义角色标注系统。
- 张育王红玲周国栋
- 关键词:语义角色标注依存句法分析
- 面向互联网新闻事件的演化式摘要生成方法
- 本发明涉及一种面向互联网新闻事件的演化式摘要生成方法,包括:输入相关新闻文档集合;通过LDA主题模型将文档表示为主题特征向量,所述主题特征向量的维数为第一预定值;将表示为主题特征向量的文档进行聚类,其中,每一类代表一个主...
- 吴仁守王红玲
- 文献传递
- 汉语篇章理解研究综述被引量:6
- 2019年
- 人们理解自然语言通常是在篇章级进行的,随着词汇级及句子级研究的日益成熟,自然语言处理研究的焦点已转向篇章级。篇章分析的主要任务就是从整体上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章。根据不同的篇章分析目的,篇章单元及其关系可以表示为不同的篇章基本结构,不同篇章基本结构及其关系的研究可提供不同层面的篇章理解。目前对汉语篇章内在规律的研究较少,缺乏对篇章进行有效分析和深入理解的理论方法体系,这严重制约了篇章级的相关研究及应用。重点关注篇章的两个最基本特征,即衔接性和连贯性,从篇章结构分析的理论研究、资源建设和计算模型这3个方面,分别探讨篇章修辞结构(体现篇章连贯性)和话题结构(体现篇章衔接性),对篇章理解的国内外研究现状进行了归纳和整理,并给出了目前存在的主要问题和研究趋势。
- 孔芳孔芳周国栋
- 关键词:自然语言理解篇章分析
- 基于单词-章节关联的科技论文摘要
- 2021年
- 为科技论文生成自动摘要,这能够帮助作者更快撰写摘要,是自动文摘的研究内容之一。相比于常见的新闻文档,科技论文具有文档结构性强、逻辑关系明确等特点。目前,主流的编码-解码的生成式文摘模型主要考虑文档的序列化信息,很少深入探究文档的篇章结构信息。为此,文中针对科技论文的特点,提出了一种基于“单词-章节-文档”层次结构的自动摘要模型,利用单词与章节的关联作用增强文本结构的层次性和层级之间的交互性,从而筛选出科技论文的关键信息。除此之外,该模型还扩充了一个上下文门控单元,旨在更新优化上下文向量,从而能更全面地捕获上下文信息。实验结果表明,提出的模型可有效提高生成文摘在ROUGE评测方法上的各项指标性能。
- 付颖王红玲王中卿
- 关键词:科技论文摘要自动文摘篇章结构
- 面向冗余度控制的中文多文档自动文摘
- 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。本文在...
- 王红玲黄超超张明慧周国栋
- 关键词:多文档自动文摘中文自动文摘
- 文献传递
- 事件信息融合方法和系统
- 本发明公开了一种事件信息融合方法和系统,用于对事件信息进行抽取、补全、事件聚类和融合,形成事件信息完整度高的完备事件。本发明实施例方法包括:生成包括多个事件的初选事件集合;比较初选事件集中的事件与事件抽取模式的相似度,形...
- 李培峰朱巧明周国栋王红玲朱晓旭
- 文献传递
- 一个办公文档类的逻辑文件系统的实现被引量:1
- 2007年
- 在简要介绍一个逻辑文件系统的设计基础上,实现了该系统的原型系统。该系统主要针对办公领域,以Oracle iFS为实现平台,采用JAVA和XML技术。它继承了语义文件系统基于内容访问的优点,并将访问方式拓宽到支持内容属性和内容结构的访问。
- 王红玲费勤吕强钱培德
- 多语言信息抽取关键技术及其应用
- 朱巧明周国栋钱龙华李培峰王红玲孔芳
- 主要科技内容:1.信息抽取关键技术的基础理论和方法研究。主要研究了包括中文命名实体识别、指代消解、关系抽取和语义角色标注等技术,结合机器学习方法,采用国际通用评测语料对核心问题提出自己的解决方案,从而在提高上述各个单项指...
- 关键词:
- 关键词:机器学习方法信息抽取系统