国家自然科学基金(60875081)
- 作品数:36 被引量:149H指数:8
- 相关作者:刘永革熊晶吴琴霞高峰钟珞更多>>
- 相关机构:安阳师范学院武汉理工大学中国海洋大学更多>>
- 发文基金:国家自然科学基金河南省教育厅自然科学基金河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于实例和本体的甲骨文机器翻译方法研究被引量:5
- 2013年
- 为解决基于实例的甲骨文机器翻译缺乏深层次语义分析的问题,引入了本体技术.采用实例和本体相结合的办法,分阶段实现甲骨文语句的机器翻译.基于实例的方法用于仅需浅层语义分析的句子,基于本体的方法用于需深层语义分析的句子.在对比分析甲骨文与现代汉语之间的内在联系基础上,建立了甲骨文知识本体,为机器翻译的词典和语义提供概念及其层次网络,解决甲骨文同义词、兼类词及词义消歧问题.实验结果表明:对常规的简单甲骨文语句,基于实例的机器翻译结果较好;对复杂的甲骨文语句,需要利用基于本体的机器翻译,其结果也基本满足研究需求.
- 熊晶钟珞王爱民
- 关键词:机器翻译本体语义相似度
- 网络传输中关键大数据加密存储系统设计被引量:6
- 2019年
- 网络时代对数据传输安全性要求较高,针对此问题设计一种新的关键大数据加密存储系统,改善网络传输中关键大数据的安全性能。该系统通过用户访问终端与服务器组传输网络关键大数据,利用密码计算引擎、AES加密模块、加密存储设备生成大数据密码、完成加密存储工作;软件部分,利用加密大数据存储分布规则、信号特征调度函数完成加密大数据优化存储;采用频率标准差衡量冗余加密大数据特征压缩系数,通过负载均衡控制压缩冗余加密大数据特性,并施加特性约束和波束校验,获取超高密度的加密大数据。研究结果表明,该系统加密频率波动小、加密存储频率高,加密结果不易破解,是一种崭新的网络传输关键大数据加密存储途径。
- 李东琦
- 关键词:网络传输加密存储
- 面向甲骨文的实例机器翻译技术研究被引量:8
- 2012年
- 提出基于实例的甲骨文释文机器翻译方案,研究实例库的构建流程、实例句相似度算法和实例检索算法等关键技术,并通过实现一个机器翻译系统,验证所提出方法的有效性。实验结果表明,该方法得到的翻译结果能够满足甲骨文学习者的阅读要求。
- 袁冬熊晶刘永革
- 关键词:甲骨文双语平行语料库句子相似度
- 基于本体的数字家庭SOA服务发现机制被引量:1
- 2012年
- SOA的关键是服务,它为WebService提供了一个架构,使用该架构组织家庭服务可以实现跨平台的服务访问。然而SOA架构大多数规范如SOAP、UDDI和WSDL等均是基于XML的,所描述的服务缺乏语义信息,因此在检索过程无法有效处理一词多义和多词一义等语法问题。通过引入本体技术,建立家庭服务领域本体,从服务的功能、内容和设备三个方面利用功能概念本体、内容本体和设备本体进行语义标注,并扩展WSDL为S-WSDL来描述家庭服务。基于本体的家庭服务发现过程分为三个阶段:查找功能、过滤服务和参数类型匹配,充分利用本体的语义优势实现了智能数字家庭服务发现。
- 熊晶钟珞王爱民魏墨济
- 关键词:本体数字家庭SOA
- 甲骨文领域语义词典的构建研究被引量:2
- 2014年
- 随着甲骨文数字化研究的不断深入,建立综合的甲骨文语义知识库已成为当前甲骨文研究的迫切要求,而语义词典则是构建语义知识库的基础。本文从甲骨文语言自身特点出发,首先明确甲骨文语义分析原则,给出了甲骨文语义分类体系;然后按照配价原则描述对应的语义属性及语义搭配;最后构造一个半自动化的甲骨文语义词典生成系统,以期更好地服务于甲骨学研究。
- 高峰田喜平刘永革
- 关键词:甲骨文语义词典语义分类语义属性
- 基于构件的甲骨文字编码器设计与实现被引量:3
- 2010年
- 甲骨文是我国迄今为止发现的最古老的较成熟的系统文字,数字化甲骨文具有重要的现实意义。本文首先阐述了甲骨文构件,以及构拆件分的重要意义;接着介绍了如何把甲骨文字拆分成树形结构的构件树;最后介绍了使用.NET实现了甲骨文字构件拆分器,并对拆分好的文字进行了编码。
- 李东琦刘永革
- 关键词:甲骨文.NET
- 利用CRF实现中文人名性别的自动识别被引量:7
- 2011年
- 受传统观念的影响,中国人名最后一个或两个字的用法对性别判定通常具有一定的指示作用,由此提出利用条件随机场模型来实现中文人名性别的自动识别.该机器学习方法根据人名的结构和用字信息,构建人名标注集,选择6组不同的特征模板集,利用条件随机场模型,在231 337个人名数据库中经过封闭测试,正确率可以达到89.30%,比采用朴素贝叶斯依赖人名用字进行性别识别的方法好将近7个百分点.实验证明:在人名库中识别性别,名字尾字的作用要高于姓氏用字,且女性人名性别识别的准确度要略高于男性,一般是高2至3个百分点,从机器学习的角度来说性别差异可以体现在人名用字中.通过分析实验数据总结了适合人名识别的CRF特征模板设计的一般规律,这为后续的研究工作提供了基础.
- 赵晓凡赵丹刘永革
- 关键词:性别识别命名实体识别条件随机场
- 一种用于汉字识别的字形编码系统设计与实现被引量:3
- 2017年
- 汉字字形变化多种多样,印刷体字符具有字体差异,手写字体更是没有统一的规则,识别难度非常大,当前用于汉字识别的字形编码方法大多依据字符,无法区分笔画相近的汉字。为此设计一种新的用于汉字识别的字形编码系统,介绍了汉字字形编码的原理,并给出了字形设计方案,依据编码原则,按照汉字被拆分的部件个数对汉字字形编码方案进行设计。详细介绍了汉字输入编辑器IME的结构,通过IME实现汉字的输入。依据汉字的使用频率与分布特性,通过数理统计工具设计含有汉字活动字库的操作系统,主要包括CC-DOS和MPC-DOS操作系统。实验结果表明,采用所设计系统对汉字进行识别精度较高且编码时间少、能耗低。
- 田喜平赵红丹
- 关键词:汉字识别
- 甲骨文大规模基础数据的语义挖掘研究被引量:10
- 2015年
- 【目的】从大规模的甲骨文基础数据中发现实体间的语义关联,为甲骨文研究提供语义支持。【方法】在文本挖掘的基础上,结合语义Web技术,将实体及其关系RDF化并在生成的RDF集合中进行语义搜索,利用本体关系和本体推理挖掘RDF对象间显式或隐式的语义关系。【结果】该方法在甲骨文文献和甲骨卜辞上的语义挖掘平均F1值分别达到74.49%和70.61%,满足甲骨文信息处理的需求。【局限】利用本体实现语义挖掘时分别基于本体库中的三个不同本体,未将本体进行集成。【结论】实体RDF化可以提供规范的结构化语义描述;Lar KC体系适用于甲骨文大规模语义处理。
- 熊晶高峰吴琴霞
- 关键词:本体语义挖掘
- 基于Lucene的甲骨文全文检索系统构建被引量:3
- 2012年
- 随着甲骨文数字化研究地不断深入,需要处理的甲骨文信息变得越来越多,对甲骨文信息地提取变得非常困难。本课题就是要研究利用基于java的全文检索工具包Luence,建立甲骨文全文检索系统,使之能够在本地硬盘完成对甲骨文的全文检索,完成全文匹配。本文通过对目标文件夹建立索引,输入关键词后,能够检索到包含该关键词的目标文件的详细信息。
- 葛彦强汪向征栗青生宋世桢
- 关键词:LUCENE检索引擎索引