公共文化服务平台

2024年8月25日星期日

|

欢迎来到贵州省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

刘小惠: 作品数：2 被引量：4H指数：2; 供职机构：昆明理工大学信息工程与自动化学院更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

莫源源云南省计算机技术应用重点实验室...
余正涛昆明理工大学信息工程与自动化学...
严馨昆明理工大学信息工程与自动化学...
线岩团昆明理工大学信息工程与自动化学...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇中文期刊文章

领域

2篇自动化与计算...

主题

2篇语料
2篇语料库
1篇英语
1篇语言
1篇平行语料
1篇平行语料库
1篇主题模型
1篇最大熵
1篇最大熵模型
1篇网页
1篇网页获取
1篇文本相似度
1篇相似度
1篇聚类
1篇可比语料库
1篇跨语言
1篇柬埔寨语
1篇层次聚类

机构

2篇上海师范大学
2篇昆明理工大学
2篇云南民族大学

作者

2篇严馨
2篇余正涛
2篇刘小惠
2篇莫源源
1篇线岩团

传媒

1篇计算机工程
1篇云南大学学报...

年份

1篇2017
1篇2016

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

融合主题和要素的汉柬可比语料获取方法被引量：3: 2017年; 为了有效地获取可比语料,选取汉柬双语新闻文档作为可比语料库的候选语料,提出一种融合发布时间要素、实体要素和主题分布的可比语料获取方法.该方法首先计算文本的主题概率分布的JS距离,并融合各主题和要素特征,计算文本相似度;然后利用改进型的层次聚类算法对双语文本进行聚类,最后从聚簇类结果中获取可比语料.与基于词典的文本相似度计算方法进行聚类相比,该文方法有更高的Purity和F值并且获得的高质量的可比语料更多,说明了本文方法的有效性.; 郭月江严馨刘小惠余正涛线岩团莫源源; 关键词：可比语料库层次聚类

基于最大熵模型的柬英平行网页获取被引量：2: 2016年; 由于平行网站的异构性和复杂性,如何自动有效获取双语平行网页以及提高平行网页的质量是构建语料库的关键问题。为此,应用最大熵模型,将平行网页的识别问题看作候选网页对的分类问题,对平行网页的获取方法进行改进。利用基于标题余弦相似性的方法或数据库查询的方法发现候选平行网页对。根据网页内容及候选网页对间余弦相似度特征和最大熵模型训练的分类器对平行网页进行识别。在特征选取上,提取网页的篇章结构特征、词汇化比例特征与页面元素特征等基本特征,并应用TF-IDF算法与余弦相似性提取文档向量的余弦相似度特征。实验结果表明,所提方法可有效提高双语网站中平行网页的召回率和准确率,所获取平行网页的准确率和召回率分别为98%,94%。; 莫源源潘丽同严馨余正涛刘小惠; 关键词：最大熵模型平行语料库

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有©2014－2015 Chongqing VIP Information., Ltd., 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张