于亚男
- 作品数:4 被引量:7H指数:1
- 供职机构:南京理工大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于签名的日志事件提取方法
- 本发明公开了一种基于签名的日志事件提取方法,由聚类过程、统计检验、迭代过程组成,聚类过程是根据匹配分数将一个数据集合划分为两个分组,并得到两个分组的签名;统计检验过程是根据聚类过程的分组结果以及Anderson‑Darl...
- 于亚男徐建张宏董克源张航朱旭超胡建洪
- 基于日志的事件挖掘方法研究与应用
- 近年来,各种IT系统规模日益庞大,架构越发复杂,在生产环境中会生成海量的日志数据。日志数据中记录着系统运行状态信息,分析日志数据能够帮助管理员了解系统运行状况,同时也可以帮助管理员进行故障原因检测、系统性能优化和异常预警...
- 于亚男
- 关键词:日志挖掘
- 基于话题相似性改进的K-means新闻话题聚类被引量:7
- 2017年
- 新闻话题聚类在舆情监督、热点话题发现、突发事件实时追踪等领域有着重要的应用。基于K-means的文本聚类算法由于算法简单易实现,时空复杂度低,聚类效果优异等特点被广泛用作新闻话题聚类算法。但传统的K-means算法又具有其局限性,如对初始中心点的选择敏感和用户必须自定义分组K等,导致算法收敛于局部最优而无法得到全局最优解。针对传统的K-means算法中初始聚类中心点随机选择导致聚类结果不稳定的问题,提出了一种改进的K-means算法用于新闻话题检测,该算法基于新闻报道相似性选择初始聚类中心点,保证各新闻话题集群具有很好的区分度。并在此基础上,根据新闻话题覆盖率自动确定话题集群个数K。实验结果表明,改进后的算法能够生成稳定的,高质量的话题集群。
- 陈龙徐建于亚男胡建洪
- 关键词:K-MEANS算法
- 一种基于签名的日志事件提取方法
- 本发明公开了一种基于签名的日志事件提取方法,由聚类过程、统计检验、迭代过程组成,聚类过程是根据匹配分数将一个数据集合划分为两个分组,并得到两个分组的签名;统计检验过程是根据聚类过程的分组结果以及Anderson‑Darl...
- 于亚男徐建张宏董克源张航朱旭超胡建洪
- 文献传递