山西大学智能信息处理研究所 作品数:24 被引量:86 H指数:5 相关作者: 郭炳 更多>> 相关机构: 太原师范学院教育学院 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 经济管理 社会学 理学 更多>>
基于PU学习的链接预测方法 2019年 基于分类的链接预测方法中,由于链接未知节点对的大规模性与不确定性,选择可靠负例成为构造链接预测分类器的难点问题.为此,文中提出基于正例和无标识样本(PU)学习的链接预测方法.首先,提取节点对的拓扑信息以构造样本集.再利用社区结构确定候选负例的分布,基于分布进行多次欠采样,获得多个候选负例子集,集成多个负例集与正例集中构建的分类器选择可靠负例.最后基于正例与可靠负例构造链接预测分类器.在4个网络数据集上的实验表明文中方法预测结果较优. 李琦 王智强 梁吉业关键词:链接预测 基于最短路径的关键蛋白质识别研究 被引量:1 2011年 关键蛋白质的识别有助于从系统水平上理解生命活动过程,基于蛋白质相互作用网络拓扑特征的关键蛋白质识别可以有效地提高识别精度和速度。通过蛋白质节点的最短路径数和点介数可以作为衡量其节点中心度的方法,但计算速度和计算规模有限。根据所预测蛋白质相互作用网络的特点,提出了基于最短路径技术的关键蛋白质识别方法,选择合理的识别阈值和拓扑参数,对全蛋白质相互作用网络的关键蛋白质进行预测。实验表明,所提出的识别方法可以有效描述蛋白质节点的重要性,在不影响计算精度的前提下,可对连通性好,边密度大的全蛋白质相互作用网络进行关键蛋白质识别。 嘉泽宁 杨贵 郑文萍关键词:蛋白质相互作用网络 最短路径 介数 依据节点贡献的链路预测方法 被引量:8 2016年 链路预测是复杂网络的一个重要研究方向,基于节点对的相似性指标进行预测是最为常用的一种方法.已有的链路预测方法通常是基于节点对的共同邻居节点的个数或度值来定义它们之间的相似性度量.然而,节点间的关系不仅与公共节点自身的性质有关,节点间联系的紧密程度也会起到一定作用.基于这个观点,提出一种新的节点对相似性指标,称为依据节点贡献(Node Contribution)的相似性指标.该指标主要通过定义节点的贡献来刻画共同邻居节点之间的联系紧密程度,进而给出节点相似性的计算方法.在六组实际数据集上的实验分析表明该方法比三种经典的链路预测方法具有更好的链路预测性能. 陈佳璐 钱宇华 张晓琴 梁新彦关键词:链路预测 非对称的异质信息网络推荐算法 被引量:8 2020年 异质信息网络作为一个新的研究方向,近年来在推荐系统领域引起了广泛的关注。目前基于异质信息网络的大部分相似度计算方法认为用户的相似关系是对称的,但是在实际中由于不同用户评分的物品数量不同,有时会导致相似关系出现非对称情况。为了能够更好地度量用户之间的相似关系,首先在均方差相似度公式的基础上,引入非对称系数刻画相似度的非对称性;然后根据元路径的特征赋予不同元路径权重,并将不同元路径的相似度结果进行加权以提高用户相似度的准确性;最后通过在矩阵分解模型中融合相似度信息与评分信息实现基于异质信息网络的评分预测推荐。在数据集上的实验结果表明,该算法在平均绝对误差和均方根误差两个评价指标上优于传统算法。 赵传 张凯涵 梁吉业关键词:相似度 矩阵分解 融合知识的多视图属性网络异常检测模型 2023年 属性网络异常检测在网络安全、电子商务和金融交易等领域中具有重要的理论与现实意义,近年来受到了越来越多的关注.大多数异常检测方法凭借网络有限的属性或结构信息进行决策生成,往往难以对异常模式做出可靠的描述.此外,网络节点对应的实体往往关联着丰富的领域知识,这些知识对于异常的识别具有重要的潜在价值.针对上述情况,提出一种融合知识的多视图网络异常检测模型,在多视图学习模式下通过数据与知识的互补融合实现了对异常节点的有效识别.首先,使用TransR模型由领域知识图谱抽取知识向量表示,并借助输入网络的拓扑关系构造其孪生网络.接着,在多视图学习框架下构建属性编码器和知识编码器,分别将属性网络及其孪生网络嵌入到各自的表示空间,并聚合为统一网络表示.最后,综合不同维度上的重构误差进行节点异常分数评价,从而识别网络中的异常节点.在真实网络数据集上的对比实验表明,提出的模型能够实现对领域知识的有效融合,并获得优于基线方法的异常检测性能. 杜航原 曹振武 王文剑 白亮关键词:异常检测 知识融合 基于邻域粗糙集的企业财务危机预警指标选择 被引量:20 2009年 财务危机预警由于其在经济管理实践中的重要性,日益受到广泛关注。就财务危机预警问题而言,首要问题是如何从大量备选指标中科学地选择预警指标。本文在对已有研究进行分析的基础上,应用邻域粗糙集模型对预警备选指标进行属性约简,得到利益相关者重点观测和预警建模所需的预警指标。研究结果显示,邻域粗糙集约简明显优于经典粗糙集约简,能够以较少的特征变量实现较高的分类精度。 宋鹏 梁吉业 曹付元关键词:邻域粗糙集 财务危机预警 自主确定社区个数的二模网络社区发现算法 被引量:8 2015年 现有算法虽然能发现二模网络的社区结构,但由于实际网络的多样性或复杂性,往往不能预知社区个数及相关信息,无法相对准确地发现真实的社区结构.针对此问题,文中提出自主确定社区个数的二模网络社区发现算法——聚类分配算法(CAA).该算法有效利用二模网络中两类节点的交互信息,解决确定社区个数的难题.对网络中的T类节点进行聚类,再将B类节点按照某种分配机制分配到已有类中.实验表明,CAA比基于资源分布矩阵的算法和基于边集聚系数的算法有更高的准确性,能获得更高质量的社区划分. 郭改改 钱宇华 张晓琴 李烨斌关键词:模块度 基于Self-Attention的句法感知汉语框架语义角色标注 2022年 框架语义角色标注(Frame Semantic Role Labeling,FSRL)是基于FrameNet标注体系的语义分析任务。语义角色标注通常对句法有很强的依赖性,目前的语义角色标注模型大多基于双向长短时记忆网络Bi-LSTM,虽然可以获取句子中的长距离依赖信息,但无法很好地获取句子中的句法信息。因此,引入Self-Attention机制来捕获句子中每个词的句法信息。实验结果表明,该模型在CFN(Chinese FrameNet,汉语框架网)数据集上的F_(1)值得到了提升,证明了融入self-attention机制可以改进汉语框架语义角色标注模型的性能。 王晓晖 李茹 王智强 柴清华 韩孝奇关键词:语义角色标注 基于节点聚类复杂度的图聚类方法 2023年 图聚类可以发现网络中的社区结构,是复杂网络分析中的一项重要任务。针对不同节点的聚类难度各异的问题,提出了一种基于节点聚类复杂度的图聚类算法(Graph Clustering Algorithm Based on Node Clustering Complexity,GCNCC),用于判断节点的聚类复杂度,为聚类复杂度低的节点赋予伪标签,利用伪标签提供的监督信息降低其他节点的聚类复杂度,进而得到网络聚类结果。GCNCC包括节点表示、节点聚类复杂度判别和图聚类3个主要模块。节点表示模块得到保持网络集聚性的表示;节点聚类复杂度判别模块用于判断网络中的低聚类复杂度节点,并利用低聚类复杂度节点的伪标签信息来优化更新网络中其他节点的聚类复杂度;图聚类模块采用标签传播方法,将低聚类复杂度节点标签传播给高聚类复杂度节点,以得到聚类结果。在3个真实的引文网络和3个生物数据集上与9种经典算法进行对比,算法GCNCC在ACC,NMI,ARI和F1等方面均表现良好。 郑文萍 王富民 刘美麟 杨贵关键词:网络嵌入 混合多属性群决策中的群体一致性分析方法 被引量:18 2011年 本文针对一类属性值为精确实数、区间数和语言值的混合型多属性群决策问题,提出了一种群体一致性分析方法。在该方法中,计算群体一致度时,首先根据专家提供的评价信息在属性层面上计算专家之间的差异度,再由此得到群体一致度,计算过程中不需进行数据类型转换,避免了数据类型转换造成的信息损失;当群体不一致时,在属性层面上给出相应的调整策略,可以使专家有针对性地修改相应属性上的评价信息,使群体尽快达成一致,同时避免了专家评价信息的过度修改。最后通过一个实例分析验证了该方法的可行性和有效性。 燕蜻 梁吉业关键词:群决策 集结