史晓东
- 作品数:71 被引量:212H指数:7
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术语言文字电子电信建筑科学更多>>
- 一种基于协同神经网络的语义角色标注方法
- 一种基于协同神经网络的语义角色标注方法,涉及语义角色标注、模式识别和协同神经网络领域,涉及将协同神经网络原理引入到浅层语义分析的方法。从训练语料和测试语料中抽取特征,并构造相应的语义特征向量;对语义特征向量进行核变换,并...
- 陈毅东黄哲煌史晓东周昌乐
- 文献传递
- 短文本情感分析的研究现状——从社交媒体到资源稀缺语言被引量:5
- 2018年
- 随着社交网络的逐渐成熟,各类语种的文本出现在社交网络上。而这些非规范的短文本蕴藏着人们对事物的褒贬、需求等意见,是国家政府和企业了解公众舆论的重要参考信息,具有重大的研究价值和应用价值。首先,对目前互联网短文本情感分析领域常用的神经网络、跨语言和应用语言学知识等研究方法进行归纳和总结;其次,对当前短文本情感分析研究的热点领域——社交媒体和资源稀缺语言的情感分析进行现状分析;最后,对短文本情感分析研究的趋势进行总结,分析存在的问题,并对未来进行展望。
- 拥措史晓东尼玛扎西
- 关键词:情感分析社交媒体
- 基于字形相似度的Unicode传统蒙文规范化方法
- 基于字形相似度的Unicode传统蒙文规范化方法,涉及文本规范化、传统蒙文编码等领域。通过遍历输入的Unicode编码的传统蒙文文本中的每个词语,将Unicode传统蒙文同形词表收录的词语均替换为其所在等价类的规范编码形...
- 史晓东王博立
- 文献传递
- 机器翻译测评的实践与分析被引量:2
- 2004年
- 机器翻译是人工智能领域中一项有挑战性的研究课题 ,而对机器翻译系统的测评也越来越受到重视。为了考察现今机器翻译系统的翻译质量及其出现的问题 ,提出了采用大规模语料库作为测试集的方法 ,对六个机器翻译系统进行了半自动测评 ,分析了机器翻译系统在词法和句法上存在的问题 ,并将测评结果与NIST自动测评进行比较 。
- 曹冬林李堂秋史晓东蔡经球
- 关键词:自动测评
- 手机短消息过滤系统的研究与实现被引量:3
- 2007年
- 如何处理手机短信息垃圾已经成为日益困扰广大用户的一个难题。介绍了一个基于智能手机平台的短信息过滤系统,基于模式分析一模式匹配的过滤方案。采用模式分析的方法自动对垃圾短信息语料库进行模式提取。并给出了系统的整体测试情况及改进方向。
- 林青史晓东
- 关键词:手机短消息
- 引入基于主题复述知识的统计机器翻译模型被引量:1
- 2014年
- 针对传统的基于双语平行语料的复述获取方法在复述获取和应用的过程中忽视文档上下文的缺点,引入基于主题模型的上下文信息来改善复述获取—主要致力于如何计算上下文无关的复述生成概率和上下文相关的复述生成概率.研究如何将上述2种概率融入统计机器翻译建模,以提高翻译系统的性能.多个测试集上的实验结果证明了该方法的有效性.
- 苏劲松董槐林陈毅东史晓东吴清强
- 关键词:统计机器翻译复述主题模型
- 机器翻译测评结果的一致性
- 机器翻译是人工智能领域中一项有挑战性的研究课题,而对机器翻译系统的测评也越来越受到重视。但机器翻译测评往往忽略了测评结果的一致性。为了定量地分析测评结果的一致性,本文提出了采用计算数据前后的变化趋势的方法,对测评结果进行...
- 曹冬林李堂秋史晓东蔡经球
- 关键词:一致性
- 文献传递
- 厦门大学第四届全国机器翻译研讨会评测系统描述
- 本文描述了厦门大学智能科学与技术系参加第四届全国机器翻译研讨会机器翻译评测的系统。文章分别对参加评测的各翻译系统的概况以及所使用的系统融合技术做了介绍,并详细描述了参与测计中的数据配置情况和结果。
- 陈毅东史晓东周昌乐
- 关键词:统计机器翻译
- 文献传递
- 大词汇量连续语音识别中的似然率快速算法及其应用
- 本文分析了基于多维混合高斯概率密度函数HMM的语音识别系统中似然率计算的时间开销,在此基础上论述了用于似然率快速计算的部分距离消去算法、最佳混合预测算法和特征矢量元素重排算法.实验结果表明,将这三种快速算法结合在一起加以...
- 蔡骏许海云胡益平史晓东
- 关键词:语音识别最大似然估计隐马尔可夫模型
- 文献传递
- 古典诗词动画自动生成研究
- 以中国古典诗词为研究对象,首次尝试将自然语言处理、计算诗学和计算机动画等相关研究成果相结合来解决古典诗词的动画自动生成.首先使用基于SVM和协同学习的分类器对古诗风格、题材以及时间进行自动判定.随后在使用Flash Ac...
- 阎思瑶郑旭玲史晓东郑发魁
- 关键词:动画生成分类器计算机技术
- 文献传递