您的位置: 专家智库 > >

国家社会科学基金(10AYY003)

作品数:24 被引量:123H指数:8
相关作者:曹存根王石罗耀华裴亚军刘亮亮更多>>
相关机构:中国科学院中国科学院大学华中师范大学更多>>
发文基金:国家社会科学基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术语言文字自然科学总论更多>>

文献类型

  • 24篇中文期刊文章

领域

  • 15篇自动化与计算...
  • 9篇语言文字
  • 3篇自然科学总论

主题

  • 5篇中文
  • 4篇知识获取
  • 3篇自然语言
  • 2篇语法化
  • 2篇语言处理
  • 2篇自然语言处理
  • 2篇聚类
  • 2篇科技名词
  • 2篇法化
  • 2篇常识
  • 1篇电视
  • 1篇电视综艺
  • 1篇电视综艺节目
  • 1篇迭代
  • 1篇迭代式
  • 1篇动因
  • 1篇短语
  • 1篇短语识别
  • 1篇叙事
  • 1篇询问

机构

  • 17篇中国科学院
  • 8篇中国科学院大...
  • 6篇华中师范大学
  • 5篇全国科学技术...
  • 4篇江苏科技大学
  • 2篇三峡大学
  • 2篇首都师范大学
  • 1篇上海对外经贸...
  • 1篇浙江师范大学
  • 1篇信阳师范学院
  • 1篇中国科学院研...
  • 1篇河南省宝丰县...

作者

  • 13篇曹存根
  • 10篇王石
  • 6篇罗耀华
  • 5篇裴亚军
  • 4篇刘亮亮
  • 4篇周晨磊
  • 3篇符建辉
  • 3篇汪平仄
  • 2篇周卫华
  • 2篇牛利
  • 2篇曹馨宇
  • 2篇夏飞
  • 1篇万莹
  • 1篇诸峰
  • 1篇孙春颖
  • 1篇王东升
  • 1篇饶琪
  • 1篇李闪闪
  • 1篇眭跃飞
  • 1篇刘青

传媒

  • 8篇中文信息学报
  • 4篇计算机科学
  • 3篇语言教学与研...
  • 3篇中国科技术语
  • 1篇汉语学习
  • 1篇计算机应用与...
  • 1篇语言文字应用
  • 1篇计算机工程与...
  • 1篇语言科学
  • 1篇计算机技术与...

年份

  • 1篇2018
  • 4篇2016
  • 2篇2015
  • 4篇2014
  • 6篇2013
  • 5篇2012
  • 1篇2011
  • 1篇2010
24 条 记 录,以下是 1-10
排序方式:
无领导小组讨论中的打断研究被引量:5
2012年
无领导小组讨论是一种新型的面试方式,参与者在讨论过程中的语言使用情况,尤其是会话过程中的打断现象,值得关注。本文立足于真实的话语文本,以会话结构理论为框架,对无领导小组讨论中的打断现象进行研究,从打断的原因、类型、互动特点和打断对面试结果的影响等方面进行了分析,认为打断是讨论中重要的话语策略,运用得当,可以使打断者取得期望的效果。
罗耀华周晨磊裴亚军
关键词:无领导小组讨论话轮打断
“X+多/少”的语法化及相关问题被引量:1
2012年
本文考察三组词:至多/至少;最多/最少;顶多/顶少。首先,辨别它们究竟是语气副词还是范围副词;其次,考察它们的语法化历程;最后,考察它们语法化的机制。本文认为这三组词可分为:"X+多1/少1"表数量限定;"X+多2/少2"表性质限度;"X+多3/少3"表主观评价。
罗耀华饶琪周晨磊
关键词:词汇化语法化
概念和定名被引量:2
2011年
概念是实现科学定名的核心要素。依据概念对科技名词进行定名,是我国科技名词定名工作的基本原则。文章以概念为基础,重点阐述了四个方面的问题:1.什么是概念;2.定名工作的任务;3.为什么要依据概念定名;4.单义的绝对性和相对性。
孙春颖裴亚军周卫华王石
叙事生成方法研究综述被引量:3
2013年
随着人工智能和自然语言处理技术的飞速发展,近年来,关于叙事自动生成的研究逐渐被人们所关注和重视。该文介绍了叙事生成的相关概念、历史背景以及当前的研究现状,总结和归纳了目前主要的叙事生成研究方法,包括基于智能规划的方法、基于常识和知识本体的方法、基于故事文法的方法等。在此基础上,对各类方法的基本思想、相关工作及主要优缺点进行了深入的分析,并探讨了当前叙事生成研究中存在的不足及未来的发展趋势。
诸峰曹存根
关键词:自然语言生成
公益性科技名词数据资源共享的原则和方法
2014年
公益性科技名词数据是一种重要的科技数据资源,也是一种重要的公共资源,应当被全社会平等共享。通过分析公益性科技名词数据的性质和特点,探讨公益性科技名词数据共享的原则和方法,希望以此建立科技名词数据共享的体制机制,促进科技创新发展。
裴亚军覃德兵
一种基于聚类与分类结合的汉语隐喻短语识别方法
2018年
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的重要地位。本研究在前人工作的实验和考察基础上,发现基于分类器来识别隐喻的方法存在数据稀疏的问题,即当训练语料中缺少需要识别的源域词数据时,分类的结果将不会太好。应对数据稀疏问题,该文提出了一种基于聚类与分类结合的隐喻短语获取方法。该方法将包含源域词S的短语进行聚类。将聚类的结果作为分类的一类特征。实验表明,使用聚类产生的特征训练出来的分类器,不仅能很好地识别训练语料中存在源域词数据的情况,也能很好地识别训练语料中缺少源域词数据的情况,具有很高的召回率。
符建辉王石王石
中文“非多字词错误”自动校对方法研究被引量:15
2016年
针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图;然后利用改进的语言模型对词图进行最短路径求解,得到分词结果,实现"非多字词错误"的自动发现和自动纠正。实验测试集是由2万行领域问答系统日志语料构成,共包含664处"非多字词错误"。实验表明,所提方法能有效发现"非多字词错误",包括由于汉字替换、缺字、多字引起的"非多字词错误",该方法的查错召回率达到75.9%,查错精度达到85%。所提方法是一种将查错与纠错融于一体的方法。
刘亮亮曹存根
关键词:词图
基于并列结构的部分整体关系获取方法被引量:2
2015年
部分整体关系是一种基础而重要的语义关系,从文本中自动获取部分整体关系是知识工程的一项基础性研究课题。该文提出了一种基于图的从Web中获取部分整体关系的方法,首先利用部分整体关系模式从Google下载语料,然后用并列结构模式从中匹配出部分概念对,据此形成图,用层次聚类算法对该图进行自动聚类,使正确的部分概念聚集在一起。在层次聚类基础上,我们挖掘并列结构的特性、图的特点和汉语的语言特点,采用惩罚逗号边、去除低频边、奖励环路、加重相同后缀和前缀等5种方法调整图中边的权重,在不损失层次聚类的高准确率条件下,大幅提高了召回率。
夏飞曹馨宇符建辉王石曹存根
关键词:图模型层次聚类
“抑”的去语法化被引量:8
2013年
汉语选择连词"抑"经历去语法化演变:疑问句句末语气词>选择连词。由于语言精密化的要求,在语序和谐性和适宜的句法位置的推动下,"抑"重新分析为疑问句选择连词,进而成为词内成分。语言接触是去语法化难以实现的因素之一。
罗耀华周晨磊
关键词:动因
一种交互式事件常识知识的获取方法
2016年
赋予机器常识知识是使机器具有真正智能的必备条件之一,而获得这些常识一直是人工智能研究的一个重要课题。该文提出了一种通过交互的方式来引导知识贡献者给出关于事件的常识知识的方法。方法获取过程是一个机器与贡献者的交互过程:机器动态地生成问题,对知识贡献者进行提问;知识贡献者通过回答问题给出常识知识。交互过程通过包含提示信息的提问问题对知识贡献者进行提示,运用七种类型问题层层递进地引导知识贡献者思考,以此唤醒他们大脑中的常识知识;通过动态变化的问题改善知识贡献者贡献常识知识过程的趣味性。同时,该文还引入可接受性和有效性两个定量标准评价提问问题,用于进一步改善交互过程。实验结果表明,知识贡献者运用此方法给出的知识量增加了451.61%,同时知识的正确率也达到了92.5%。
曹聪曹存根臧良军王石
关键词:交互过程
共3页<123>
聚类工具0