延边大学工学院计算机科学与技术学科 作品数:43 被引量:53 H指数:4 相关作者: 蔡京哲 侯继文 刘宝超 李京 王梦娇 更多>> 相关机构: 东南大学经济管理学院 东南大学经济管理学院系统工程研究所 黄淮学院计算机科学系 更多>> 发文基金: 吉林省科技发展计划基金 吉林省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 轻工技术与工程 理学 文化科学 更多>>
朝鲜文字信息结构的研究 被引量:1 2011年 该文研究了朝鲜文字空间结构中不同位置上的基本字母对文字结构的分类所提供的信息贡献。首先,提出了文字的结构距离的概念与计算方法,描述了不同结构之间的差异;其次,研究了文字结构的等价类划分方法以及文字结构的概率分布;最后,通过计算结构分类时不同位置上的基本字母的信息增益,刻画了文字中信息的分布结构。对实际朝鲜语文档的实验表明,c1-v2、c1-v1-c3、c1-v2-c3型结构的文字具有显著的高概率特性,v1、v2类型和c3类型字母对结构分类的影响最大。 崔荣一 金世珍关键词:信息增益 基于术语自动抽取的科技文献翻译辅助系统的设计 被引量:4 2017年 设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中建立术语库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求. 黄政豪 崔荣一关键词:术语抽取 基于帧符号化的语音相似性度量方法 2014年 提出了将语音帧符号化后度量语音相似性的方法.首先,去除语音段中的静音部分,并提取每帧语音的MFCC参数;其次,将MFCC参数进行k均值聚类和KNN分类,并根据分类结果对语音信号进行符号化;最后,采用编辑距离计算语音段之间的相似性.实验表明,将语音符号化后,音频之间的可区分性更加明显,识别率也有了明显提高. 刘双君 金小峰 崔荣一关键词:K均值聚类 KNN分类 符号化 基于分布式图计算的学术论文推荐算法 被引量:5 2019年 针对海量论文数据导致的应用效率低下问题,提出一个基于层次混合模型的推荐算法WSVD++。该模型根据学术论文良好的结构特征,构建一个加权的论文二部图模型。首先对论文进行特征提取,按不同特征的权重构建论文的复合关系图;其次对关系图采用一种改进的PPR算法,计算每篇论文的重要程度,依此来对用户—论文关系进行加权;然后在构建好的加权二部图模型上混合SVD++图算法进行推荐。实验结果表明,改善了推荐算法学术论文的推荐效果,并且基于分布式图计算框架GraphX,扩展性好,适合大数据处理。 潘峰 怀丽波 崔荣一关键词:协同过滤 基于数据库的高校设备采购管理系统的应用研究 被引量:2 2008年 本系统是基于数据库基础开发了一套高校设备采购管理系统,极大地提高了设备采购管理工作人员的工作效率,大大减少了以往出现的管理杂乱的弊端,实现了设备采购管理的操作的自动化和信息的电子化,从而全面提高了全校设备材料采购管理水平。 赵亚慧关键词:数据库 设备管理 WAVE网络中基于DCF的信道预约方案的时延分析 2015年 以车载环境下的无线接入(wireless access in vehicular environments,WAVE)网络中基于DCF的信道预约方案为基础,通过排队论的分析方法得出了采用该方案时系统中用户预约服务信道所需的平均时延,并研究了系统的主要参数对该平均时延的影响.研究结果表明,预约数据包生成的速率和最小竞争窗口对平均时延影响较大,最大退避阶数对平均时延影响较小. 刘娇 朱东弼关键词:WAVE DCF机制 信道预约 时延 线性化朝鲜文字的歧义性研究 被引量:2 2008年 该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字重构时存在歧义性的必要条件和充分条件,并分析了线性化文字序列歧义度的本质和歧义性发生的概率;最后,讨论了文字重构歧义性消除的方案,给出了基于基本字母的在线式朝鲜文字序列输入算法和核心步骤,通过仿真实验验证了该方案的可靠性和有效性。 蔡京哲 崔荣一关键词:计算机应用 中文信息处理 基于最大Jaccard相似度的互激励实体验证算法 被引量:1 2015年 针对基于规则的信息抽取技术提出了一种互激励实体验证算法.该算法兼顾了信息抽取过程中互激励算法的优点,并在此基础上引入了实体等待队列,用于存储未被成功验证的实体,并以最大Jaccard相似度为原则进行实体验证.实验结果表明,将该算法应用在基于规则的参考文献命名实体抽取中,其抽取的准确率要比SermeX系统高约15%,比Para Tools系统高约40%. 刘宝超 崔荣一关键词:信息抽取 面向cocos2dx的代码混淆器的设计与实现 2015年 针对目前使用的代码混淆技术不能完全适用于手机的问题,在分析常用的代码混淆技术的基础上,提出用于手机引擎cocos2dx的基于代码匹配的混淆方法,即在外形(layout)混淆的基础上利用代码匹配技术搜索相同功能的代码并替换成更难让人读懂的形态.试验分析表明,该方法的混淆效果好于传统外形混淆效果,执行程序过程中不仅没有降低运行效率,在某些情况下运行效率还有所提升. 王晓宇 蔡京哲关键词:代码混淆 手机软件 基于编辑距离的中文机构名简称检索方法研究 被引量:1 2010年 文章针对基于中文机构名简称的检索方法,研究了机构名的结构特征,提出了中文机构名简称和全称匹配的一种新算法的应用,通过计算中文机构名简称与机构名全称的编辑距离,达到快速检索目标机构的目的。仿真实验结果表明:所提的方法准确性较好,首选准确率较高,达到了适用要求。 赵亚慧关键词:文本分类 分词算法