您的位置: 专家智库 > >

陈振宁

作品数:10 被引量:26H指数:3
供职机构:浙江大学人文学院更多>>
发文基金:教育部人文社会科学研究基金国家社会科学基金更多>>
相关领域:语言文字自动化与计算机技术更多>>

文献类型

  • 9篇期刊文章
  • 1篇会议论文

领域

  • 6篇语言文字
  • 4篇自动化与计算...

主题

  • 3篇时间信息
  • 3篇聚类
  • 2篇现代汉语
  • 2篇现代汉语句子
  • 2篇汉语
  • 2篇汉语句子
  • 2篇翻译
  • 1篇地图
  • 1篇地图分析
  • 1篇动词
  • 1篇动词性
  • 1篇对齐
  • 1篇信息处理
  • 1篇赢家
  • 1篇赢家通吃
  • 1篇语法化
  • 1篇语法学
  • 1篇语力
  • 1篇语气
  • 1篇语气系统

机构

  • 9篇复旦大学
  • 7篇浙江大学
  • 2篇四川师范大学
  • 1篇武汉工业学院
  • 1篇国家开放大学

作者

  • 10篇陈振宁
  • 8篇陈振宇
  • 1篇杜克华

传媒

  • 5篇语言研究集刊
  • 3篇中文信息学报
  • 1篇中国语文

年份

  • 1篇2018
  • 2篇2017
  • 1篇2016
  • 3篇2015
  • 1篇2011
  • 1篇2005
  • 1篇2004
10 条 记 录,以下是 1-10
排序方式:
一种基于对齐的时间信息提取方案
2011年
怎样将给定的汉语文本中的时间信息提取出来,是当代计算语言学的一个难点。本方案将时间体和事件归为同一类型,即"时间单位",在逻辑上将它们描写为五阶段模型:起始前状态、起始、持续状态、终结、终结后状态。每一个阶段都附有对论元之间关系的逻辑描写。从单位的凸显阶段可以抽象出三种时间指针:事件指针、参考指针、指示指针。在它们和对齐规则的帮助下,可以推出单位之间的对齐关系。接着运用一些与上下文无关的规则和原则,对结论进行修正,以便把蕴涵在文本中的信息更为详细地描写出来。在对齐和修正过程的同时,句中的功能性成分也会实施某种改写操作,以便更准确地反映说话者的意图。
陈振宇陈振宁
关键词:对齐改写
用语图分析揭示语言系统中的隐性规律——赢家通吃和赢多输少算法被引量:5
2015年
该文用"图"这一数学工具,通过定量分析来揭示语言系统中的隐性规律,设计了"赢家通吃"和"赢多输少"两种生成算法,将理想算法"步步竞争、择优而行"的博弈论思路贯彻到非理想状态。两种新算法都较前人有更好的概括能力。赢多输少算法更兼顾了充分概括和适度概括均衡。生成语图后,该设计着重准确率的最小简图和着重覆盖率的最大简图归纳算法,挖掘控制的主流规则、分析语言系统的语言学规律。在最小简图基础上提出控制度公式以评价语言系统。
陈振宁陈振宇
关键词:图论博弈论
成都话“哇字句”语用功能的形成被引量:1
2016年
文章从多个方面对成都话'哇字句'进行分析,并运用'加权最少边地图'对调查的数据进行自动聚类分析,印证'哇字句'除了疑问,还有非疑问性陈述、感叹、祈使等用法,其中间过渡异常复杂。倾向性疑问应该是'哇字句'语法化的起点,后随句子的意外性加强,句子的否定功能也越来越强,最终'哇字句'跨过了边界,形成了以感叹功能为主的用法。
杜克华陈振宇陈振宁
关键词:自动聚类语法化
为什么“不、没(有)2、别”是副词而不是附缀——汉语句子结构的类型
2015年
世界上的语言,大多只有一个小句核心,它带有显性的核心标记,如时、一致性等。整个小句是在这一核心基础上构成的。但汉语的核心没有显性的标记,所以只能以它的"动词性"特征来识别它,我们称为枢纽,枢纽必须是动词或动词性功能词。"多重套叠主从结构"理论认为,在汉语的句子中有多层简单的结构。其中每一个结构都由一个枢纽控制,但整个句子有多个层次,所以有多个枢纽的位置。句子否定词"不、没(有)2、别"必须加在动词性枢纽上,而不能在其他成分上,所以它们只能是副词。
陈振宇陈振宁
关键词:副词动词性
怎样计算现代汉语句子的时间信息
现代汉语句子的时间信息,是由句中的各个单位及其关系共同编码的,因此必须建立起整体的时间认知模型才能计算。包括三个方面:1、将时间性质分解为事件的基本阶段(起始、持续、终结)、事件的时段(确定时段、相对小量、相对大量)和认...
陈振宇陈振宁
关键词:现代汉语
文献传递
基于多维特征聚类和关联的语气研究——以北京话语气成分“啊”为例被引量:2
2018年
语气是分层多维系统,语气成分的多功能模糊性如一团“量子云”,在具体语境的分层多维特征作用下“收敛”到某一功能,多功能间有着家族相似性的关联。文章通过对真实文本语料进行多维特征的梳理,运用聚类和关联挖掘算法研究了北京话语气成分“啊”的复杂功能:起源典型叹词,在态度和情绪层表示强意外(反预期+强情绪),和命题意义结合后从说者指向反预期到听者指向反预期;主要是以强意外到强语力的“感叹语气词”;少数在正面/中性情感环境中反预期性逐步消失,语力趋向中性;功能层次“高”导致其句法层次“高”,容易脱离句子独立插入语篇,在北京话中成为“过于常用”的插入语,转向纯粹人际语篇功能,语力大为磨损;最后语力磨损到成为可有可无的习语成分。
陈振宁王梦颖
关键词:语气系统语力
怎样计算现代汉语句子的时间信息被引量:7
2005年
现代汉语句子的时间信息,是由句中的各个单位及其关系共同编码的,因此必须建立起整体的时间认知模型才能计算。包括三个方面:1 将时间性质分解为事件的基本阶段(起始、持续、终结)、事件的时段(确定时段、相对小量、相对大量)和认知窗口的时间基点等认知要素,对事件类型进行分类,在此基础上,构建有关时间的认知模型。2 对现代汉语句子中可能出现的每一单位和关系,用事件类型符号和时间要素符号进行翻译,所得的结果———该单位或关系的元语言表述式(翻译式)———表明了该单位或关系在编码时间信息时究竟表现什么意义。3 在认知模型中建立一个由规则驱动的运算系统,将元语言表述式化简为最简表述,它即是句子整体编码的时间信息。
陈振宇陈振宁
关键词:计算机应用中文信息处理现代汉语
通过地图分析揭示语法学中的隐性规律——“加权最少边地图”被引量:14
2015年
类型学中常用语义地图来分析和展示跨语言的差异。但是如何在已知数据的基础上构建语义地图?传统的方法未考虑到出现频率,而且往往有多个地图的可能,给我们的地图仅仅是跨语言变项演示中的某一可能的地图,所以传统方法需要批判。本文将展示一种新的方法论意义上的操作,通过一步步地吸收出现频率的数据,在优先选择和优先赋值的原则上,建立"加权最少边地图"。我们也将它运用到更广泛的语法研究领域,并给出一些有关人类社会的普遍性结论。我们还设立了一个指数,以评估给定数据中的隐性控制程度。
陈振宇陈振宁
旁指、他称与人称——他人、其他人、别人、旁人、人家被引量:2
2017年
'人'类词语从泛称开始,在他称(无限)式中和旁指融合,并在旁指标记影响下逐步演化到第三人称。语法化进程的语义动力是旁指引发的被排除对象X和指向对象Y的对立。生命度高的第一人称、第二人称更易成为对立起点,即被排除对象X经常排除'我或/和你',而指向对象Y则从普遍性的通指逐步具体化,其指向从不确定归于确定。第三人称使得语篇特性从叙述描写进入会话,语用机制的作用下,人类偏好建立同盟关系,促使小称'人、人家'进一步演化:建立同盟的主要手段是贬低说者,'人家'出现较多第一人称用法;建立同盟的次要手段是贬低听者以彰显'打是亲骂是爱'的亲昵性,'人家'在对亲昵听者撒娇埋怨的环境中也可表示第二人称,用例更少。
陈振宁
关键词:他称旁指生命度同盟小称
基于偏向相似性的自然语言关联和聚类研究被引量:3
2017年
聚类按关联进行分类,关联和聚类分析的基础是相似性计算。通常相似性是指绝对相似性,具有对称性。但自然语言研究中发现大部分规律都是偏向的,具有不对称性,需要用偏向的思路来考察不对称的关联和聚类策略:以类似条件概率的概率蕴涵指标来描写特征间的不对称关联,并在此基础上定义优势关系、紧密关系、控制中心、中途岛等关联特性;基于偏向相似性的聚类策略,从而能更好地处理语言本体研究中的"假性孤立点"、数据稀疏问题和家族象似性类型的聚类。
陈振宁陈振宇
关键词:聚类
共1页<1>
聚类工具0