2024年7月11日
星期四
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
张玉亮
作品数:
1
被引量:2
H指数:1
供职机构:
内蒙古师范大学计算机与信息工程学院
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
语言文字
自动化与计算机技术
更多>>
合作作者
哈斯
内蒙古师范大学计算机与信息工程...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
1篇
语言文字
主题
1篇
信息抽取
1篇
语料
1篇
爬虫
1篇
网络
1篇
文本识别
1篇
蒙古文
1篇
古文
1篇
抽取
机构
1篇
内蒙古师范大...
作者
1篇
哈斯
1篇
张玉亮
传媒
1篇
内蒙古师范大...
年份
1篇
2016
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
蒙古文网络文本识别与采集方法
被引量:2
2016年
笔者主要研究实现了蒙古文网页的内容识别,以及使用网络爬虫爬取网页,并自动提取网页中的蒙古文文本,在此基础上将对网络文本做词频统计研究。利用HTML标记、栏目归属、标点符号等自然标注信息对这些文本进行抽取,可以构建篇章语料和文本分类语料,可以抽取互联网词库,进行词频统计和训练语言模型,这些语料可用于命名实体识别、信息检索、统计机器翻译等研究领域。
张玉亮
哈斯
关键词:
蒙古文
爬虫
语料
信息抽取
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张