练睿婷
- 作品数:7 被引量:15H指数:3
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 动机驱动的认知对话系统的关键技术研究
- 使机器拥有自然语言交流能力是人工智能的终极目标之一,自图灵测试被提出以来,机器的对话能力也一直被当作衡量系统智能程度的标准。近年来,对话系统更是成为人工智能在商业领域的热点,各种对话系统纷纷发布并,如苹果的Siri,微软...
- 练睿婷
- 关键词:逻辑推理知识表示
- 文献传递
- 语篇标注语料库的建设研究
- 本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间的关系类型进行标注,并标注了能充分反应语篇信息的各种词汇关系。本研究所产生的语料库可用于基于语...
- 练睿婷史晓东
- 关键词:汉字处理语料库建设数理语言学
- 文献传递
- 基于HowNet的中文语义依存分析被引量:3
- 2010年
- 在对自然语言进行信息处理的过程中,人们发现只是进行词法和句法分析是远远不够,还需要进行语义分析。语义依存分析是语义分析的一种可行方案。本文描述了一个基于HowNet的中文语义分析系统。该系统以含有短语句法信息的句子作为输入,首先确定每个短语的中心词,得到句子的依存结构;然后以存在依存关系的句法成分对作为语义标注的基本单元,利用基于HowNet所建立的语义信息结构库确定其语义关系,最终实现整个句子的语义依存分析。从滨州树库中随机抽取的100个句子,共2783个词对进行测试,系统在语义信息结构库中找到语义关系的词对为2546,标注比例达到91.5%。
- 唐怡周昌乐练睿婷
- 关键词:语义分析知网
- 神经网络和匹配融合的中文分词研究被引量:5
- 2010年
- 分词是中文信息处理的基础。本文提出一种使用误差反传神经网络与一种改进的匹配算法相结合的中文分词技术,此方法不需要标注或语义信息,适应性、鲁棒性好,且训练结果占用空间小、有一定冗余性,对比与单纯的神经网络分词方法和匹配的分词方法正确率有了较多的提高。
- 李华陈硕练睿婷
- 关键词:神经网络误差反传中文分词BP
- 语篇标注语料库的建设研究
- 本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间的关系类型进行标注,并标注了能充分反应语篇信息的各种词汇关系。本研究所产生的语料库可用于基于语...
- 练睿婷史晓东
- 关键词:语料库
- 文献传递
- 一种改进的KEA关键词抽取算法研究被引量:7
- 2011年
- 本文在关键词抽取工具KEA(Keyphrase Extraction Algorithm)的基础上,对候选关键词的选取方法及其特征属性抽取进行改进。考虑到KEA中使用的贝叶斯分类器对特征间的独立性假设引起的一些问题,本文采用了与KEA不同的机器学习方法—人工神经网络来训练模型。我们将改进后的模型应用于中文关键词抽取。实验结果表明,改进后的关键词抽取模型对于中文关键词的抽取效果要优于KEA。
- 陈平周昌乐练睿婷
- 关键词:抽取KEA
- 基于聚类的中文词汇链构建算法的研究
- 本文结合传统的词汇链构建算法的思想,将词汇链的构建看成是一个聚类问题,并引入了语篇中词汇之间的句法关系、基于HowNet的词义相似度计算、基于语料库的词义相关度计算三种聚类特征,探讨中文词汇链的构建算法。
- 练睿婷史晓东
- 关键词:聚类算法信息处理