马驰宇
- 作品数:3 被引量:11H指数:2
- 供职机构:合肥工业大学管理学院过程优化与智能决策教育部重点实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LDA模型和AP聚类的主题演化分析被引量:7
- 2016年
- 随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管控。针对单个主题演化分析方法中阈值设定和主题漂移的问题,提出一种LDA-AP主题演化模型。该方法利用LDA模型对不同时间窗口内的新闻文本分别进行建模,得到相应的主题。利用AP聚类算法对不同时间窗口内的多个主题进行聚类,其中计算主题相似度采用加入时间衰减因子的JS散度来度量。最后对多个主题内容进行演化分析。通过相关的实验分析和对比,结果表明该方法可以改善主题演化的性能,并能较好地分析多个新闻主题事件随时间的演化趋势。
- 倪丽萍刘小军马驰宇
- 关键词:LDA模型
- 基于本体的股票主题事件案例推理系统研究被引量:2
- 2016年
- 股票市场中一些事件容易影响股票的价格及收益。为辅助投资者积累经验性知识及快速做出决策,文中在收集主题事件的基本信息及市场波动数据的基础上,结合本体理论和案例推理方法,通过对事件案例的本体结构定义以及对金融事件类型本体的构建,开发了股票市场主题事件案例的推理系统原型。该系统用OWL-DL语言描述本体,采用Protégé4.2构建本体库;通过分析主题事件的特征属性,用相似性度量方法检索相似案例,进而对目标事件做出详细分析。通过特定事件对股票市场的走势分析,验证了用相似案例进行市场短期预测具有可行性,同时引入本体后在推理系统的查全率上有了明显的提高,从而说明该方法是合理的、有效的。
- 何岩新倪丽萍曹琳马驰宇
- 关键词:本体案例库股票市场
- 社会化信息对股市波动影响分析——基于SparkR平台的实现被引量:2
- 2017年
- 社会信息化的飞速发展使得社会化信息日益丰富。这些信息会对股市波动产生一定影响,然而这些信息数量巨大且多属于非结构化数据,使得分析社会化信息对市场的影响具有一定的难度。尝试通过分布式计算技术来解决这个问题,并从信息量和信息情感两个方面考察社会化信息对股市的影响。通过搭建SparkR平台,首先讨论如何利用该平台解决大数据环境下股市社会化信息的特征选择以及情感分类问题,其次对比了信息量和信息情感对市场的影响情况,说明信息情感变化更能准确说明市场的波动变化情况。为进一步验证方案的可行性,定义了不同的情感计量方式并对比了不同方案的优缺点,进而给出分析社会化信息对股市波动影响的综合解决方案,并且通过实验验证了该方案的有效性。
- 倪丽萍马驰宇刘小军
- 关键词:文本挖掘情感分类