您的位置: 专家智库 > >

中央高校基本科研业务费专项资金(65010571)

作品数:3 被引量:12H指数:2
相关作者:黄亚楼刘杰王扬谢茂强廖振更多>>
相关机构:南开大学更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇信息检索
  • 1篇序列熵
  • 1篇随机场
  • 1篇缩略
  • 1篇缩略词
  • 1篇条件随机场
  • 1篇泛化
  • 1篇CRF

机构

  • 3篇南开大学

作者

  • 3篇刘杰
  • 3篇黄亚楼
  • 2篇卢敏
  • 2篇廖振
  • 2篇谢茂强
  • 2篇王扬
  • 1篇刘天笔
  • 1篇刘才华
  • 1篇陈季梦

传媒

  • 2篇计算机研究与...
  • 1篇计算机工程

年份

  • 1篇2013
  • 1篇2012
  • 1篇2011
3 条 记 录,以下是 1-3
排序方式:
基于半监督CRF的缩略词扩展解释识别被引量:2
2013年
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习。为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词。使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系。实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法。
陈季梦刘杰黄亚楼刘天笔刘才华
关键词:条件随机场序列熵
多查询相关的排序支持向量机融合算法被引量:7
2011年
排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提出一种基于有监督学习的融合多个与查询相关排序子模型的方法.该方法为每一个查询及其相关文档建立一个子排序模型,并将子排序模型的输出进行向量化表示,将多个查询相关的排序模型转化为体现查询差异的特征数据,实现多排序模型的集成.以排序支持向量机为例,在查询级和样本级建立新的损失函数作为优化目标,并利用此损失函数调节不同查询产生损失之间的权重,提出多查询相关的排序支持向量机融合算法.在文档检索和网页检索中的实验结果表明,使用多查询相关的排序支持向量机融合算法可以取得比传统排序学习模型更好的性能.
王扬黄亚楼谢茂强刘杰卢敏廖振
关键词:信息检索
代价敏感的列表排序算法被引量:3
2012年
排序学习是信息检索与机器学习中的研究热点之一.在信息检索中,预测排序列表中顶部排序非常重要.但是,排序学习中一类经典的排序算法——列表排序算法——无法强调预测排序列表中顶部排序.为了解决此问题,将代价敏感学习的思想融入到列表排序算法中,提出代价敏感的列表排序算法框架.该框架是在列表排序算法的损失函数中对文档引入权重,且基于性能评价指标NDCG计算文档的权重.在此基础之上,进一步证明了代价敏感的列表排序算法的损失函数是NDCG损失的上界.为了验证代价敏感的列表排序算法的有效性,在此框架下提出了一种代价敏感的ListMLE排序算法,并对该算法开展序保持与泛化性的理论研究工作,从理论上验证了该算法具有序保持特性.在基准数据集上的实验结果表明,在预测排序列表中顶部排序中,代价敏感的ListMLE比传统排序学习算法能取得更好的性能.
卢敏黄亚楼谢茂强王扬刘杰廖振
共1页<1>
聚类工具0