刘晓婉
- 作品数:3 被引量:12H指数:1
- 供职机构:长春工业大学更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 开源中文分词器在web搜索引擎中的应用被引量:12
- 2013年
- 目前,在信息检索方面,一般分词器对英文的支持相对较好,但对中文分词效果不太理想;随着web搜索在互联网中的广泛应用,中文分词器也出现了突飞猛进的发展,尤其以IKAnalyzer分词器为主的分词工具,为更多企事业单位所采纳。本文主要在词条化等方面对分词原理进行深入的分析,并且对如何构造智能分词词典进行了探讨。同时,对分词内部结构进行研究,在分词数目和速率方面对目前主流的中文分词器进行了比较,并运用htmlparser库对北京邮电大学的网站进行解析,采用分词工具Paoding Analysis建立索引文件存入本地,利用solt4.0全文搜索服务器给出运用中文分词后的查询效果图,实现对北京邮电大学网站的全文搜索功能。
- 刘晓婉胡燕祝艾新波
- 关键词:WEB搜索信息检索全文搜索
- 面向微博的医学健康智能搜索的研究与应用
- 随着互联网的广泛应用,web上的数据信息正在呈指数级增长,因此,如何在这种海量级的数据中查找到目标信息并对其进行自动处理已成为当前重点的研究课题。现在信息速度急剧上升,以微博、微信等新媒体所产生的巨大的碎片化信息极具代表...
- 刘晓婉
- 关键词:文本聚类
- 文献传递
- 雨滴谱图像分割算法的研究
- 传统的雨滴谱数据检测主要通过人工测量的方式来实现,这种方法工序繁杂,易受人为因素和采集设备的影响,给雨滴谱数据的检测结果带来误差,并且带有一定主观性。本文结合生产实际问题,在充分研究前人成果的基础上,针对雨滴谱分类问题,...
- 刘晓婉
- 关键词:图像预处理
- 文献传递