您的位置: 专家智库 > >

魏庭新

作品数:16 被引量:44H指数:3
供职机构:南京师范大学国际文化教育学院更多>>
发文基金:国家自然科学基金国家社会科学基金江苏省教育厅哲学社会科学基金更多>>
相关领域:自动化与计算机技术语言文字文学更多>>

文献类型

  • 15篇期刊文章
  • 1篇学位论文

领域

  • 11篇自动化与计算...
  • 4篇语言文字
  • 1篇文学

主题

  • 8篇汉语
  • 4篇语义表示
  • 4篇神经网
  • 4篇神经网络
  • 4篇中文
  • 3篇语义
  • 2篇对外汉语
  • 2篇对外汉语教学
  • 2篇语料
  • 2篇语料库
  • 2篇自动识别
  • 2篇现代汉语
  • 2篇连动结构
  • 2篇连动句
  • 2篇介词
  • 2篇句法
  • 2篇基于神经网络
  • 2篇兼语
  • 2篇兼语结构
  • 2篇教学

机构

  • 15篇南京师范大学
  • 2篇昆山震川高级...
  • 1篇北京语言大学
  • 1篇南京农业大学
  • 1篇闽江学院
  • 1篇南瑞集团有限...

作者

  • 16篇魏庭新
  • 12篇曲维光
  • 9篇顾彦慧
  • 8篇李斌
  • 2篇孙超
  • 1篇王东波
  • 1篇周露
  • 1篇冯敏萱
  • 1篇周俊生
  • 1篇宋丽

传媒

  • 4篇中文信息学报
  • 1篇清华大学学报...
  • 1篇厦门大学学报...
  • 1篇计算机工程
  • 1篇图书馆论坛
  • 1篇计算机工程与...
  • 1篇南京师大学报...
  • 1篇池州师专学报
  • 1篇华文教学与研...
  • 1篇云南师范大学...
  • 1篇南京师范大学...
  • 1篇数据分析与知...

年份

  • 1篇2025
  • 2篇2024
  • 2篇2023
  • 2篇2022
  • 3篇2021
  • 1篇2020
  • 1篇2018
  • 1篇2016
  • 2篇2007
  • 1篇2004
16 条 记 录,以下是 1-10
排序方式:
基于特征融合的汉语被动句自动识别研究
2024年
汉语中的被动句根据有无被动标记词可分为有标记被动句和无标记被动句。由于其形态构成复杂多样,给自然语言理解带来很大困难,因此实现汉语被动句的自动识别对自然语言处理下游任务具有重要意义。该文构建了一个被动句语料库,提出了一个融合词性和动词论元框架信息的PC-BERT-CNN模型,对汉语被动句进行自动识别。实验结果表明,该文提出的模型能够准确地识别汉语被动句,其中有标记被动句识别F1值达到98.77%,无标记被动句识别F1值达到96.72%。
胡康曲维光曲维光魏庭新李斌李斌
关键词:汉语被动句自动识别语料库
面向中文AMR标注体系的兼语语料库构建及兼语结构识别被引量:1
2021年
兼语结构是汉语中常见的一种动词结构,由述宾短语与主谓短语共享兼语,结构复杂,给句法分析造成困难,因此兼语识别工作对于语义解析及下游任务都具有重要意义。但现存兼语语料库较少,面向中文抽象语义表示(AMR)标注体系的兼语语料库构建仍处于空白阶段。针对这一现状,该文总结出一套兼语语料库标注规范,构建了包含4760个兼语句的面向中文AMR标注体系的兼语语料库。基于构建的语料库,采用LA-BiLSTM-CRF模型识别兼语结构,达到了86.06%的F1,并分析了识别结果,提出了改进方向。
侯文惠曲维光魏庭新魏庭新李斌顾彦慧
关键词:兼语结构
基于神经网络的复句判定及其关系识别研究被引量:1
2021年
复句是自然语言的基本单位之一,复句的判定及其语义关系的识别,对于句法解析、篇章理解等都有着非常重要的作用。基于神经网络模型识别自然语料中的复句,判断其复句关系,构造复句判定和复句关系识别联合模型,以最大程度地减少误差传递。在复句判定任务中通过Bi-LSTM获得上下文语义信息,采用注意力机制捕获句内跨距离搭配信息,利用CNN捕获句子局部信息。在复句关系识别任务中,使用Bert增强句子的语义表示,运用Tree-LSTM对句法结构和成分标记进行建模。在CAMR中文语料上的实验结果表明,基于注意力机制的复句判定模型F1值达到91.7%,基于Tree-LSTM的复句关系识别模型F1值达到69.15%。在联合模型中,2项任务的F1值分别达到92.15%和66.25%,说明联合学习能够使不同任务获得更多特征,从而提高模型性能。
贾旭楠魏庭新曲维光曲维光顾彦慧
关键词:神经网络语义建模
基于神经网络的连动句识别被引量:1
2022年
连动句是具备连动结构的句子,是汉语中一种特殊的句法结构,在现代汉语中十分常见且使用频繁。连动句语法结构和语义关系都很复杂,在识别中存在许多问题,对此该文针对连动句的识别问题进行了研究,提出了一种基于神经网络的连动句识别方法。该方法分两步:第一步,运用简单的规则对语料进行预处理;第二步,利用文本分类的思想,使用BERT编码,利用多层CNN与BiLSTM模型联合提取特征进行分类,进而完成连动句识别任务。在人工标注的语料上进行实验,实验结果达到92.71%的准确率,F_(1)值为87.41%。
孙超曲维光曲维光顾彦慧魏庭新顾彦慧
关键词:连动句文本分类神经网络
不同编班方式对初级阶段留学生汉语学习的影响效应研究被引量:1
2016年
本文通过问卷调查了单语班和混合班两种编班方式下留学生使用媒介语和目的语的情况以及他们的语言焦虑度,并比较了他们的学习效果。结果发现,单语班母语使用量远远高于混合班,但目的语使用量基本持平;单语班语言焦虑度低于混合班,混合班中汉语使用量与语言焦虑度之间存在负相关关系;在学习效果方面,学习初期单语班的效果要好于混合班,但这种效应随着时间的推移而逐渐减弱。
魏庭新
关键词:目的语媒介语焦虑度
大语言模型下古诗笺注知识库的构建与应用
2025年
古诗中典故、意象、专名等具有高语义复杂度的组块桎梏大众对古诗的语义理解。文章对古诗中的复杂语义组块进行梳理并分类;借助大语言模型的文本处理与信息抽取能力,对搜集到的各类词典知识进行整合处理,构建用于古诗笺注的知识库,并在古诗自动笺注和翻译任务中进行验证与应用。实验结果显示,构建的笺注知识库在古诗的五个关键组块笺注任务上,宏平均F1值达93.90%,优于现有的笺注方案。利用知识库再次预训练得到的古诗领域语言模型AnnoKB_GLM,在古诗机器翻译任务上的性能超越现有现代汉语通用大语言模型和古籍文本基座模型,验证了该笺注知识库的实用价值。
李佳斌魏庭新曲维光李斌冯敏萱王东波
关键词:知识库构建
基于深度学习的中文零代词识别被引量:1
2021年
针对中文零代词识别任务,提出了一种基于深度神经网络的中文零代词识别模型.首先,通过注意力机制利用零代词的上下文来帮助表示缺省的语义信息.然后,利用Tree-LSTM挖掘零代词上下文的句法结构信息.最后,利用语义信息和句法结构信息的融合特征识别零代词.实验结果表明,相对于以往的零代词识别方法,该方法能够有效提升识别效果,在中文OntoNotes5.0数据集上的F1值达到63.7%.
王立凯曲维光魏庭新周俊生顾彦慧李斌
现代汉语介词结构位置的考察及影响其位置的句法、语义因素分析
本文主要统计了现代汉语中的介词结构的位置分布情况,重点考察了《汉语水平词汇与汉字等级大纲》中的介词所能出现的位置及分布情况比例,发现:现代汉语中介词结构可能出现的位置有三个,分别为:主语前、主语谓语之间和谓语后;对于绝大...
魏庭新
关键词:介词教学句法语义对外汉语教学
文献传递
词向量和语义知识相结合的汉语未登录词语义预测研究被引量:2
2020年
【目的】将词向量和语义知识相结合,提高未登录词语义预测的准确性。【方法】抓取含有未登录词网页的语料,利用Word2Vec等模型得到词语的分布式表示信息,再结合构词语义知识对候选词进行中心词和词性过滤,实现未登录词的语义预测。【结果】在人民日报语料未登录词测试集上的实验结果表明,模型预测正确率可达87.5%,高于只使用词语内部知识的模型和只使用外部分布信息的词向量模型。【局限】无法预测语义不透明的未登录词。【结论】将携带词语外部信息的词向量与词语内部特征相结合,显著提高了未登录词语义预测的正确率,说明词语内、外部信息对于语义的组成有重要作用。
魏庭新柏文雷曲维光
关键词:未登录词语义知识
中文连动句语义关系识别研究
2024年
连动句是形如“NP+VP1+VP2”的句子,句中含有两个或两个以上的动词(或动词结构)且动词的施事为同一对象。相同结构的连动句可以表示多种不同的语义关系。该文基于前人对连动句中VP1和VP2之间的语义关系分类,标注了连动句语义关系数据集,基于神经网络完成了对连动句语义关系的识别。该方法将连动句语义识别任务进行分解,基于BERT进行编码,利用BiLSTM-CRF先识别出连动句中连动词(VP)及其主语(NP),再基于融合连动词信息的编码,利用BiLSTM-Attention对连动词进行关系判别,实验结果验证了该文所提方法的有效性。
孙超孙超魏庭新曲维光魏庭新顾彦慧
关键词:连动结构神经网络
共2页<12>
聚类工具0