广州市越秀区科技计划项目(2012-TP-005)
- 作品数:3 被引量:58H指数:3
- 相关作者:蒋盛益王连喜吴美玲陈东沂庞观松更多>>
- 相关机构:广东外语外贸大学淘宝(中国)软件有限公司更多>>
- 发文基金:广州市越秀区科技计划项目国家自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 面向不平衡数据的特征加权聚类算法被引量:4
- 2013年
- 不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据当前聚类后簇的特点以及特征重要性度量函数确定特征权值,利用所得权值进行下一轮聚类,直到权值稳定后结束迭代.在多个UCI不平衡数据集上的实验效果表明,本文算法能够较好地识别出重要特征并提高它们的权重,避免聚类算法过度偏向多数类,有效地提高了聚类性能.
- 蒋盛益苗邦王连喜
- 关键词:不平衡数据特征加权
- 微博信息可信度分析研究综述被引量:42
- 2013年
- 简述微博信息可信度研究的背景和意义,并对微博信息可信度分析等相关概念进行界定;对微博信息可信度的研究成果进行梳理,指出这些研究的不足,并认为微博信息可信度分析的关键问题是微博信息特征的提取和可信度分析方法的设计;结合微博信息的特点及已有研究成果,指出微博信息可信度分析的核心技术包括自然语言处理、社会网络分析、机器学习与数据挖掘等;最后总结全文,对微博信息可信度分析的未来发展方向进行展望,为进一步研究提供参考。
- 蒋盛益陈东沂庞观松吴美玲王连喜
- 关键词:信息可信度自然语言处理社会网络分析
- 中文音乐情感词典构建及情感分类方法研究被引量:12
- 2014年
- 作为仅次于及时通信和搜索引擎的中国互联网网民第三大应用,网络音乐及其应用技术受到业界学者的青睐。音乐作为人类最重要的交流媒介,携带着丰富的情感信息,计算机音乐情感分析更是得到人机情感交互技术领域的高度重视。在基于歌词文本的音乐情感分析过程中,一部合理的音乐领域情感词典,将提供更加细致、更加准确的分析结果。以改进后的Hevner情感环模型为基础,借助How Net所提供的语义资源和从网络爬取的歌词文本语料库,构建了一部树形层次结构的音乐领域中文情感词典,并利用LRC歌词携带的时间标签获取歌曲的语速信息,实现了基于情感向量空间模型和情感词典的歌词情感分类。实验表明与人工构建的情感词典相比,所构建的情感词典更适用于音乐领域。
- 蒋盛益阳垚廖静欣
- 关键词:知网