任晓东
- 作品数:2 被引量:21H指数:2
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:山西省自然科学基金山西省回国留学人员科研经费资助项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于K-Modes聚类的自适应话题追踪技术被引量:13
- 2009年
- 传统自适应话题追踪用向量空间模型表示一个话题模型,通常会对话题模型更新带来错误的反馈。针对传统自适应话题追踪中话题模型的不足,提出基于K-Modes聚类的自适应话题追踪方法(K-MATT方法),用话题类中心代替话题模型,把命名实体向量空间模型作为话题类中心,在追踪过程中不断迭代更新话题类中心,直到话题类中心稳定。实验证明K-MATT方法是有效的。
- 任晓东张永奎薛晓飞
- 基于新闻要素的新事件检测方法研究被引量:9
- 2008年
- 新事件检测(NED)的目标是检测出报道一个新闻话题种子事件的第一个新闻。考虑到新闻的基本要素在新闻中的作用,采用特征加权的方式对传统的词频和倒排文档频率(TF-IDF)模型进行改进,并在新闻报道中提取出时间信息和地点信息,分别对内容相似度、时间相似度和地点相似度进行计算,并将三者结合来检测新事件。实验证明这种方法有效。
- 薛晓飞张永奎任晓东
- 关键词:新事件检测相似度计算