张冬梅
- 作品数:4 被引量:26H指数:1
- 供职机构:北京林业大学信息学院更多>>
- 发文基金:中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于改进DSE算法的web信息抽取
- 2012年
- 随着我国信息化进程的推进,人们开始认识到互联网作为信息来源的重要性,如何更有效地从网络的海量信息中抽取所需要的内容并进行合理的组织和利用已经成为亟待解决的问题。本文通过对DSE算法和RoadRunner系统中的算法的探讨和改进,提出了一种新的自动生成模板的信息抽取方法,并且在确定同模板网页url的阈值时引入了生物信息学中的FDR方法,为阈值的确定提出了理论根据。实验结果表明,经过改进的抽取方法对抽取结果的准确率有着明显的改善作用。
- 张冬梅陈钊陈剑
- 关键词:信息抽取文档对象模型
- 林产品贸易信息推送梯级过滤技术被引量:1
- 2012年
- 目前信息推送服务广泛应用于各类电子商务网站,然而传统信息过滤技术在林产品贸易信息过滤的过程中,存在着不足。在总结林产品贸易信息过滤的特点的基础上,提出梯级过滤技术。该技术根据林产品贸易用户兴趣的不同、用户需求程度的不同、林产品贸易信息特征项权重的不同,在提出林产品贸易信息特征向量空间模型和分析用户兴趣特征向量结构的基础上,采用先进行用户显性需求的严格过滤,再进行用户显性需求的模糊过滤,再进行用户隐性需求的过滤的梯级过滤方法,从而达到准确满足用户需求的目的。实验结果证明该方法能够有效地过滤出用户满意的信息。
- 陈剑张冬梅陈钊
- 关键词:信息过滤信息推送信息服务推荐系统
- Web信息抽取技术综述被引量:24
- 2010年
- 快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一定的相似性,基于DOM树结构和基于模板的抽取技术发展很快而且已经得到了广泛的应用。分别论述了上述几类技术在近几年来的研究进展,从自动化程度、适用范围和复杂性三个角度分析对比了几类技术的优缺点。
- 陈钊张冬梅
- 关键词:WEB信息抽取MDR视觉特征
- 信息管理与信息系统专业本科生技能分类培养模式初探被引量:1
- 2015年
- 分析北京林业大学信息管理与信息系统本科专业历届就业情况,针对近年来用人单位对IT类专业毕业生技能要求的特点,提出对学生进行因材施教、因势利导的技能分类培养,建议在培养方案相对稳定的客观条件下,灵活运用实验、实习、课程设计、毕业设计等环节,分层次、分阶段地进行技能训练。
- 陈钊张冬梅陈剑
- 关键词:信息管理与信息系统专业本科生