贾彩燕 作品数:48 被引量:170 H指数:9 供职机构: 北京交通大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 自然科学总论 更多>>
基于图自监督对比学习的社交媒体谣言检测 2023年 网络社交媒体的快速发展提供了便捷的信息获取方式,但也滋生了谣言和虚假新闻,现有的谣言检测模型在有标注数据充足时能有效解决分类问题,然而谣言可用的标注数据有限,各种针对谣言特点精心设计的模型倾向于过拟合,同时,现有模型的鲁棒性不足,谣言传播者恶意破坏谣言传播结构会使模型出现分类错误.针对以上问题,采用自监督的图对比学习方法,对原始谣言传播图进行不同方式的数据增强来模拟对原图的扰动,建立自监督对比学习任务,使图编码器捕获谣言更趋本质的特征,缓解了过拟合,提高了模型的鲁棒性与泛化性能.在来源于主流社交媒体平台的三个公开数据集Twitter15,Twitter16和PHEME上进行了对比实验,实验结果显示,提出的模型的准确率比基准模型分别提高3.4%,1.8%和1.2%,证实了图自监督对比学习方法在谣言检测任务上的有效性. 乔禹涵 贾彩燕一种基于复杂网络的感认知行为与分子网络机制关联方法 本发明提供了一种基于复杂网络的感认知行为与人体分子网络关联方法。该方法包括:构建感知与认知行为表型相关的分子网络;构建神经、免疫、内分泌和微生态相关的分子网络;基于构建的分子网络利用网络平均最短路径长度和网络相关性指标,... 杨扩 周雪忠 贾彩燕 董鑫基于统计推理的社区发现模型综述 社区有助于揭示复杂网络结构和个体间的关系,研究人员从不同视角提出很多社区发现方法,用来识别团内紧密、团间稀疏的网络结构。自2006 年提出了一些基于统计推理的社区发现方法,其可识别实际网络中更多的潜在结构,以其可靠的理论... 柴变芳 贾彩燕 于剑文献传递 面向自然语言推理的基于截断高斯距离的自注意力机制 被引量:2 2020年 在自然语言理解任务中,注意力机制由于可以有效捕获词在上下文语境中的重要程度并提高自然语言理解任务的有效性而受到了人们的普遍关注。基于注意力机制的非递归深度网络Transformer,不仅以非常少的参数和训练时间取得了机器翻译学习任务的最优性能,还在自然语言推理(Gaussian-Transformer)、词表示学习(Bert)等任务中取得了令人瞩目的成绩。目前Gaussian-Transformer已成为自然语言推理任务性能最好的方法之一。然而,在Transformer中引入Gaussian先验分布对词的位置信息进行编码,虽然可以大大提升邻近词的重要程度,但由于Gaussian分布中非邻近词的重要性会快速趋向于0,对当前词的表示有重要作用的非邻近词的影响会随着距离的加深消失殆尽。因此,文中面向自然语言推理任务,提出了一种基于截断高斯距离分布的自注意力机制,该方法不仅可以凸显邻近词的重要性,还可以保留对当前词表示具有重要作用的非邻近词的信息。在自然语言推理基准数据集SNLI和MultiNLI上的实验结果证实,截断高斯距离分布自注意力机制能够更有效地提取句子中词语的相对位置信息。 张鹏飞 张鹏飞 贾彩燕一种基于密度差异的离群点检测算法 被引量:2 2015年 在MMOD算法的基础上提出一种改进算法IMMOD,该算法考虑各属性的差异对离群点检测的影响,通过引入信息熵来确定属性的重要程度以量化权重向量,进而采用加权距离计算各数据点相异性。此外,在处理高维数据时,确定次要属性后采用属性约简方法,在保证时间效率的同时提高检测精度。理论分析和试验结果表明IM M OD算法参数少、检测准确性高,能很好地适用于高维数据,整体性能优于同类算法。 辛丽玲 何威 于剑 贾彩燕关键词:离群点检测 OUTLIER 加权距离 属性约简 融合重叠社区正则化及隐式反馈的协同过滤方法 2021年 针对目前推荐系统存在的数据稀疏和冷启动等问题,提出了一种融合重叠社区正则化及隐式反馈的协同过滤方法(OCRIF),该方法不仅考虑了用户在社交网络中的社区结构,而且将用户评分信息与社交信息的隐式反馈融入推荐模型之中。此外,由于网络表示学习可以有效学习节点在社交网络的全局结构上的近邻信息,提出了一种网络表示学习增强的OCRIF(OCRIF+),该方法结合社交网络中用户在网络中的低维表示与用户-商品特征,能更有效地刻画用户之间的相似度及用户对兴趣社区的归属度。多个真实数据集上的实验结果显示:所提出的方法的推荐效果优于同类方法,与TrustSVD方法相比,在FilmTrust、DouBan以及Ciao数据集上,该方法的均方根误差(RMSE)分别下降了2.74%、2.55%以及1.83%,平均绝对误差(MAE)分别下降了3.47%、2.97%以及2.40%。 李翔锟 贾彩燕关键词:协同过滤 推荐系统 社交网络 网络嵌入 基于词共现网络的微博话题发现方法 被引量:3 2018年 微博作为一个重要的信息平台,每天都有大量用户访问,重要的舆论事件在微博上会形成热门话题。本文提出了一种新的微博话题发现方法:基于词共现网络的话题发现方法(Topic detection in freqent word network,TDFWN),来挖掘微博语料中蕴含的热点话题。该方法首先对微博文本中的k频繁词集(k≥3)进行挖掘,利用频繁词集的共现关系构建词共现网络。对该网络进行社区划分,同一社区内的词通常描述同一微博话题,即话题以社区的形式出现。实验结果表明TDFWN算法能够快速、全面地发现微博中的热门话题,并且可以实现微博文本的自动聚类。 李伟 贾彩燕基于对齐性和均匀性约束的图神经网络会话推荐方法 2024年 会话推荐(session-based recommendation,SBR)旨在匿名状态下通过用户的短期历史行为序列来预测下一个待点击的项目。为解决现有基于图神经网络(graph neural networks,GNNs)的会话推荐方法忽略会话中不同位置相同项目之间差异的问题,在图卷积获得项目表示后,进一步考虑该项目与相邻项目之间的相关性,生成邻域相关的项目表示。此外,鉴于对齐性和均匀性在对比学习中的起到的重要作用,还提出了一种适用于会话推荐的对齐性和均匀性损失方法,以约束生成的会话表示和项目表示。在3个公开数据集上的实验表明,文中提出的模型TAU-GNN的推荐性能优于对比的主流会话推荐模型。 唐韬韬 楚飞 汪炅 贾彩燕关键词:均匀性 邻域信息 基于双图神经网络信息融合的文本分类方法 被引量:2 2022年 近年来,图神经网络在文本分类任务中得到了广泛应用。与图卷积网络相比,基于消息传递的文本级的图神经网络模型具有内存占用少和支持在线检测等优点。然而此类模型通常仅使用词共现信息为语料中的各个文本构建词汇图,导致获取到的信息缺少多样性。文中提出了一种基于双图神经网络信息融合的文本分类方法。该方法在保留原有词共现图的基础上,根据单词间的余弦相似度构建语义图,并通过阈值控制语义图的稀疏程度,更有效地利用了文本的多方位语义信息。此外,测试了直接融合和注意力机制融合两种方式对词汇图和语义图上学习到的文本表示融合的能力。实验使用R8和R52等12个文本分类领域常用的数据集来测试算法的精度,结果表明,与最新的TextLevelGNN,TextING和MPAD这3个文本级的图神经网络模型相比,双图模型能够有效提高文本分类的性能。 闫佳丹 贾彩燕关键词:文本分类 语义信息 信息融合 自然语言处理 一种融合社交关系的矩阵分解推荐模型 被引量:4 2020年 推荐系统可以有效解决信息过载问题,为用户提供个性化的推荐服务。然而在评分矩阵稀疏的情况下,仅通过分析用户项目评分矩阵来生成预测结果的传统模型效果较差。针对该问题,利用用户评分以及用户社会信任关系两部分信息计算用户相似度,提出一种融合社交关系的矩阵分解型推荐模型SoRegIM。通过挖掘社交网络中用户的拓扑关系,利用目标用户的直接邻居与间接邻居信息构建加权社会信任网络,在充分使用用户社交关系信息的同时减少冗余的社交噪声。基于公开数据集的实验结果表明,与SoReg、SocialMF等7种经典模型相比,SoRegIM能够有效提高推荐准确性,且对于稀疏数据的提升效果明显。 吴清春 贾彩燕关键词:社交网络 推荐系统 拓扑关系 信任网络 矩阵分解