刘晓明
- 作品数:50 被引量:22H指数:3
- 供职机构:西安交通大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术经济管理电气工程动力工程及工程热物理更多>>
- 一种社区发现的方法
- 本发明公开了一种社区发现的方法,包括以下步骤:1)利用MapReduce模型实现并行计算;2)在Map阶段,将计算任务分为N份,每份计算任务包括随机游走过程和数据处理过程,其中通过随机游走获得复杂网络的一个遍历节点序列,...
- 周亚东刘晓明管晓宏胡成臣
- 一种基于Bert和残差自注意力机制的政务文件主题分类方法
- 本发明一种基于Bert和残差自注意力机制的政务文件主题分类方法,包括政务文件原始特征抽取和选择、政务文件原始特征清洗和优化、文本预训练以及基于残差自注意力机制的主题标签分类,本发明针对政务数据多源异构的特点,提出了统一的...
- 周亚东曹天文高泱晗朱皓宬刘晓明管晓宏
- 一种社交噪音文本实体关系抽取优化方法及系统
- 本发明一种社交噪音文本实体关系抽取优化方法及系统,可解决社交文本领域数据标注成本大、数据更新速度快、数据集本身存在偏差以及原有模型可能陷入虚假相关性的问题。该方法将因果推断引入自然语言处理生成词向量的过程中,应用因果推断...
- 刘晓明李承祖冯乙洋多小川贺靖涵
- 多源异构关系网络的群体发现方法、系统、设备及介质
- 本发明属于图数据挖掘领域,公开了一种多源异构关系网络的群体发现方法、系统、设备及介质,包括:获取多源异构关系网络内任意两个用户间的交互行为数据;根据任意两个用户间的交互行为数据,得到任意两个用户间的边权值;其中,边权值用...
- 刘晓明詹明威简禧彦沈超周亚东
- 文献传递
- 一种基于用户个性化特征的社交网络用户行为预测方法
- 本发明公开了一种基于用户个性化特征的社交网络用户行为预测方法,首先基于若干社交网络用户的多维行为属性数据,构建不同类别的用户标记向量;对社交网络用户进行分类,划分为不同归属类别的用户,并对其行为进行行为特征向量转化,得到...
- 刘晓明李敏杰沈超周亚东管晓宏
- 文献传递
- 一种动态时空事件预测方法及系统
- 本发明公开了一种动态时空事件预测方法及系统,包括将事件行为信息、地点信息及其交互特征信息嵌入到事件潜在特征,利用嵌入后的事件潜在特征构建事件数据二部图;分别计算不同事件地点和不同事件行为之间的紧密程度,得到地点边权值矩阵...
- 刘晓明张占伟吴少聪张兆晗沈超
- 一种面向社交网络不规则短文本的粤语分词方法
- 本发明涉及一种面向社交网络不规则短文本的粤语分词方法,属于自然语言处理领域。本发明的面向粤语语境的短文本清洗和分词的方法,具体包括四个功能模块,分别为支持用户自定义的短文本清洗模块、粤语联合语料库构建模块、短文本扫描和初...
- 周亚东高泱晗边策刘晓明沈超管晓宏
- 一种基于网站流量日志数据与优化谱聚类算法的恶意爬虫检测方法
- 一种基于网站流量日志数据与优化谱聚类算法的恶意爬虫检测方法,包括:预处理日志数据,过滤非页面请求,从请求记录中筛选相关字段用于爬虫检测;为每个cookie生成页面请求序列,基于页面请求序列,计算任意两cookie间行为相...
- 周亚东岳天一刘晓明沈超
- 文献传递
- 一种网络话题的内容焦点迁移识别方法被引量:14
- 2015年
- 随着网络信息技术的迅速发展,互联网已经成为人们获取和发布信息的最重要平台之一.在互联网的信息传播过程中,话题相关文本不断更新,而其内容焦点也随着话题发展发生着迁移.识别话题内容焦点有助于有效地挖掘与分析网络信息,是网络舆情分析领域的重要研究问题.文中针对网络流文本,提出了一种网络话题内容焦点的识别方法,首先对话题焦点特征在流文本中的分布情况进行分析,基于分析结果介绍了焦点识别方法3个主要步骤的算法模型,分别是基于时间属性的焦点特征词提取、内容焦点特征词的合并和内容焦点的表示.文本基于来自于真实网络的实际数据,对所提方法进行了实验验证,实验结果表明文中所提方法可有效获取话题发展过程中的内容焦点,并能以关键词集和语句集的形式对内容焦点进行表示.
- 周亚东刘晓明杜友田管晓宏刘霁
- 关键词:舆情分析社交网络社会计算
- 基于循环神经网络和差分自编码器的异常轨迹检测方法及系统
- 本发明公开了一种基于循环神经网络和差分自编码器的异常轨迹检测方法及系统,包括:对采集到的原始轨迹数据进行分段,获取分段后的轨迹数据;将目标地图划分为若干个网格,对分段后的轨迹数据进行离散化处理,获取离散化轨迹数据;对离散...
- 刘晓明赵清源沈超