吴桂兴
所属机构: 中国科学技术大学软件学院 所在地区: 安徽省 合肥市 研究方向: 自动化与计算机技术 发文基金: 江苏省自然科学基金
相关作者
吴敏 作品数:72 被引量:323 H指数:10 供职机构:中国科学技术大学软件学院 研究主题:高校 英语 大学英语听说 校园网 研讨班 郭燕 作品数:9 被引量:13 H指数:3 供职机构:中国科学技术大学苏州研究院 研究主题:无线传感器网络 信息分布 计算机 介词 最大熵模型 郭燕 作品数:9 被引量:4 H指数:1 供职机构:中国科学技术大学软件学院 研究主题:大学计算机教育 画线 漫画 ISCSI 边缘检测算法 杜一民 作品数:2 被引量:2 H指数:1 供职机构:中国科学技术大学软件学院 研究主题:搭配错误 语言模型 WINNOW 介词 向量 袁宇丹 作品数:2 被引量:1 H指数:1 供职机构:中国科学技术大学软件学院 研究主题:集成电路设计 集成电路 实践教学探索 实践教学 设计人才培养
基于层次语言模型的英语动名词搭配纠错策略 被引量:1 2017年 搭配的正确使用是区分地道英语使用者和普通学习者的一个重要特征.通过分析中国英语学习者语料库(CLEC),可以发现动名词搭配错误是英语学习者易犯的错误.本文提出一种可用于纠正英语学习者动名词搭配错误的层次语言模型.该语言模型考虑到了句子内部词语之间的依赖关系,将句子处理为不同的层次的子句,同一个句子内部的单词高度相关,不同子句内的单词相关性弱.该语言模型对于句子成分的变化得到的结果更加稳定,而且搭配信息得到浓缩,得到的语言模型更加精确.本文将模型用于生成分类器特征和结果排序.这种层次语言模型应用到英语动名词搭配的检错纠错中,对比传统语言模型,会有更好的效果. 李灿润 吴桂兴 吴敏面向多视角对比学习和语义增强的多模态预训练方法 2024年 视觉语言预训练(VLP)模型通过对比学习等方法,在多模态任务上表现出了优异的性能。然而现有研究忽视了多视角描述带来的好处,以及语义和语法的重要性。为了解决这一问题,文中提出了多视角对比学习和语义增强多模态预训练(Multi-view learning and Semantic Enhancement for Multimodal pre-training,MulSE)模型。MulSE主要分为3个部分:1)在融合编码器模型中,引入带有生成器的多视角对比学习;2)提出了一种新的自监督视觉语言预训练任务——多模态文本重排序;3)增加并探寻最优MLM掩码比例,最大化利用视觉信息的能力。通过改进预训练任务,采取多种最优策略,并通过实验验证MulSE增强了模态内部和模态间的理解能力以及对文本语法和语义的理解能力。预训练仅用4×106的数据量,在图文检索任务中就达到了先前大型数据集的效果,且其在视觉问答和视觉蕴含任务上的评估效果优于先前的理解式VLP模型。 汤嘉 郭燕 叶名玮 吴桂兴关键词:计算机视觉 多模态 基于最大熵模型的介词纠错系统 2016年 英语介词纠错系统,针对英语学习者英语语言中常见的介词错误进行计算机自动纠正.首先,对标注过得语料库中介词错误进行了分类统计,总结出21种常见介词,在英语wiki语料库中利用计算机自动错误插值算法获得训练集合.然后在训练集合基础之上,通过使用基于最大熵模型的分类器,选择了包括上下文、介词补足语等特征,在训练集上进行模型的训练,最后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小、迭代次数对于测试集效果的影响,并且比较了朴素贝叶斯模型的结果,最后在测试数据达到27.68的F值,相对于Co NLL2013的shared task中最好结果有小幅提升. 李悦 吴敏 吴桂兴 郭燕关键词:最大熵模型 基于介词向量的英语真词错误检查算法 2015年 在基于Winnow算法的基础上引入混淆词和介词搭配的方法.首先通过混淆集获得训练集,对训练集进行预处理后利用文本特征提取方法获得特征词集,然后对特征词集进行Winnow训练得到带有权重的特征词集并把出现在混淆词后的介词提取出来生成介词向量,最后从测试集提取特征并进行结合Winnow算法和混淆词与介词搭配方法的测试得到真词错误检查的结果.混淆词与介词搭配方法的加入使得某些混淆词的正确率、召回率以及F1测度提高了10%~20%,有的甚至提高到了100%. 霍娟娟 吴敏 吴桂兴 郭燕 陈朝才 杜一民关键词:介词 WINNOW 一种基于加密域可逆水印的H.265视频认证加密方案 2017年 轻量级视频加密技术和近年来兴起的加密域可逆水印技术为视频的认证加密提供了新的技术支撑,但现有的加密域可逆水印技术大多数局限于静态图像,而视频的认证加密不能直接使用传统静态图像的数字水印方案。在此背景下,提出一种加密域可逆数字水印方案,并利用它实现视频的认证加密。该方案基于H.265/HEVC视频编码标准,通过在DCT域对变换系数进行操作,能够把加密和可逆水印嵌入进行分离,进而可以实现在已经加密的视频中可逆地嵌入消息认证码(Message Authentication Code,MAC),最终同时实现内容安全性保护与完整性认证。实验表明该方案不仅能在加密的视频中嵌入可逆水印,还能对视频的篡改进行定位。 项煜东 吴桂兴关键词:视频加密 认证加密 基于回归模型的中央监控平台设计与实现 2024年 中央监控平台是一个以数据为中心的服务器保护平台。该平台通过组合服务器上的哨兵来防止数据免受泄露和攻击,同时对系统的运行状态进行全面的监测。通过数据分析,并运用数理统计的方法,在可提供的计算力与系统资源利用率之间建立线性回归模型。该模型解释了在某一资源消耗状态下,系统可提供的计算力估算值,在可允许误差为0.1的情况下,其准确率可以达到97%以上,为当前系统运行状态做出精准的评估。 张国经 吴桂兴 黄婷关键词:TPM 基于大语言模型的命名实体识别 2024年 虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题,提出并设计了基于情境学习和模型微调的新方法,使NLG语言模型在识别命名实体达到了更好的效果,并且该方法不同于其他方法需要改变基层模型的预训练参数.同时,由于命名实体是模型生成的结果而不是对原始数据的分类,不存在边界问题.为了验证新框架在命名实体识别任务上的有效性,本文在多个中文命名实体识别数据集上进行了实验.其中,在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%,相较于SOTA模型分别提高了0.4和2.7个百分点,从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务. 叶名玮 汤嘉 郭燕 吴桂兴关键词:命名实体识别 情境学习 基于骨架模态的多级门控图卷积动作识别网络 被引量:1 2022年 人类动作识别是一个极具挑战性的研究课题,广泛应用于安全监控、人机交互和自动驾驶等领域。近年来,图卷积网络在建模非欧几里德结构数据上取得了巨大成功,为骨架模态动作识别提供了新思路。由于骨架预定义图包含大量噪声,现有方法多使用高阶空域特征对空间依赖性进行建模。然而,仅关注高阶子集并不能在全局上反映顶点之间的动态相关性。此外,主流方法中模拟时间依赖性使用的卷积神经网络或循环神经网络也无法捕获多范围的时序关系。为了解决这些问题,文中提出了一种基于骨架模态的多级门控图卷积动作识别网络框架。具体地,提出了门控时序卷积模块来提取时域顶点之间的多时期依赖关系;同时,通过多维注意力机制来增强图的全局表征。为了验证所提方法的有效性,在NTU-RGB+D和Kinetics两个大型视频行为识别基准数据集上进行了实验。结果表明,所提方法的性能优于目前最先进的方法。 干创 吴桂兴 詹庆原 王鹏焜 彭志磊关键词:视频分类 计算机视觉 一种解决英语动名词搭配错误的模型 被引量:2 2016年 英语学习者易犯动名词搭配错误。通过分析CLEC中的动名词搭配错误,提出一种纠正中国学习者的动名词搭配错误的模型。首先构建了一个动名词搭配库,接着提出了一种度量搭配间的相似度的方法,通过计算目标搭配和搭配库的相似度得到粗略的相似搭配集,使用分类的方法过滤掉相似搭配集中不能将测试句划为正确类的搭配,得到候选结果集,最后使用语言模型对候选结果集打分排序,得到最终的纠正建议。在使用BNC构造的测试集上,这种综合相似性推理和上下文特征的方法对动名词搭配纠错具有显著效果。 杜一民 吴桂兴 吴敏关键词:搭配错误 语言模型 改进粒子群BP算法的四六级翻译评分模型 被引量:3 2015年 针对四六级考试翻译题型,给出了一种基于改进PSO-BP神经网络的评分方法.通过BLEU和SVD等算法获取到文本特征值以及老师评分作为输入集,然后用该集合对改进PSO-BP神经网络进行训练,训练好的BP神经网络可以用来预测翻译分数.从惯性权值计算和适应度函数两方面优化了PSO-BP算法,在全局范围内寻找最优解,使得实验效果更加稳定.用Matlab进行了仿真实验,结果表明,在翻译评分中,使用改进PSO-BP神经网络比采用多元线性回归能获得更好的相关性,与人工评分的皮尔逊相关系数平均提高了12%. 唐泽 吴敏 吴桂兴 郭燕关键词:MATLAB仿真