广西壮族自治区自然科学基金(2012GXNSFAA053225) 作品数:14 被引量:47 H指数:5 相关作者: 蒙祖强 林啟锋 蒋亮 常红岩 杨俊瑶 更多>> 相关机构: 广西大学 更多>> 发文基金: 国家自然科学基金 广西壮族自治区自然科学基金 广西教育厅科研项目 更多>> 相关领域: 自动化与计算机技术 更多>>
基于要素提取关联词对的中文报道关系检测 被引量:2 2013年 针对现有中文报道关系检测的检测代价即误报率和丢失率较高的问题,在多向量空间模型基础上提取不同向量的要素(时间、地点、人物和内容)特征词组成关联词对,使用支持向量机(SVM)方法整合关联词对相似度和余弦相似度,从而提出了一种提取要素关联词对报道关系检测方法。所提方法补充表示了报道内容,为检测提供了更多的比较依据,识别代价降低了将近11%。实验结果验证了算法的有效性。 陈智敏 蒙祖强 林啟锋基于混合蛙跳与阴影集优化的粗糙模糊聚类算法 被引量:7 2015年 针对粗糙模糊聚类算法对初值敏感、易陷入局部最优和聚类性能依赖阈值选择等问题,提出一种混合蛙跳与阴影集优化的粗糙模糊聚类算法(SFLA-SRFCM).通过设置自适应调节因子,以增加混合蛙跳算法的局部搜索能力;利用类簇上、下近似集的模糊类内紧密度和模糊类间分离度构造新的适应度函数;采用阴影集自适应获取类簇阈值.实验结果表明,SFLA-SRFCM算法是有效的,并且具有更好的聚类精度和有效性指标. 蒙祖强 胡玉兰 蒋亮 常红岩关键词:粗糙集 混合蛙跳算法 结合语义和文本特征位串的高效KNN算法 被引量:1 2013年 为了有效提高文本分类的效率,提出了一种基于语义相似的改进KNN算法。该算法结合了特征词的语义和文本的特征位串,由于考虑到文本向量中同义的关联特征词对文本相似度的贡献,有效地提高了文本分类的准确率和召回率;而基于文本特征位串进行的位计算方法,能从大量的训练文本集中筛选出可能的相似文本,较好地克服了KNN算法计算量大的问题。算法的分析与实验表明,改进的算法明显提高了KNN的计算效率,同时也提高了分类的准确率和召回率。 林啟锋 蒙祖强 陈秋莲 陈智敏关键词:语义关联 K最近邻算法 文本分类 一种基于拓扑信息的物流频繁路径挖掘算法 被引量:7 2015年 为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路径序列深度剪枝的代价容忍度剪枝方法,该方法在利用Apriori性质剪枝的基础上进一步去除了部分不可能是频繁路径序列的候选路径序列,这在一定程度上缩减了候选路径序列规模,从而减少了对数据集的扫描。实验表明,相比没有采用该剪枝方法的同等算法,PMWTI具有更高的频繁路径挖掘效率。 杨俊瑶 蒙祖强 蒋亮关键词:物流 数据挖掘 一种基于向量夹角的快速计算等价类算法 被引量:3 2015年 等价类是Rough集理论的核心概念之一,如何高效地计算等价类是提高各相关算法性能的关键.引入高维空间向量夹角的概念,根据数据在机器中的存储特点,以字节内容的最大值加1作为基数对数据进行基数排序,在此基础上设计以计算向量夹角来求信息系统等价类的算法.该算法把原来计算等价类的逻辑比较转换为数值计算,非常显著地提高了等价类的计算效率,尤其对大规模高维数据.该算法的时间复杂度为O(|C‖U|log|U|),理论分析与实验结果表明了该算法的正确性和高效性. 蒋亮 蒙祖强 胡玉兰 常红岩关键词:ROUGH集 信息系统 等价类 空间向量 一种运用相容语义块约简的网络话题检测方法 被引量:1 2013年 针对已有基于词聚类的话题检测方法存在的缺点,本文利用网络文档的半结构化特征提供的语义信息以及利用词在语义上下文的共现频率定义词之间的语义相似度,然后构建文档集的词共现语义网络,实现词之间语义关联的建模;据此提出相容语义块的概念,并通过对相容语义块的构建、分裂和约简来实现对话题的检测,进而提出一种基于相容语义块约简的网络话题检测方法.该方法获得的结果稳定,表现话题的词集简短而富有表达力,因而十分适合于网络话题检测,实验亦说明它的这些优点以及它的有效性和可行性. 蒙祖强 徐杨 杨俊瑶关键词:语义相似度 基于GN算法的微博社区识别方法 被引量:5 2013年 近年来,社交网络用户数量剧增,关于社交网络上的社区发现成为一种新的需要解决的问题。这里获取微博上的用户以及用户之间的关系作为研究样本,基于微博用户以及用户之间的关系,构建网络社区模型,在此基础上,利用GN算法对微博用户进行社区划分;为了提高算法的运行速度,采用模块度增量,在得出近似结果时就停止,减少运行时间。并在获取的数据上加以验证,GN算法适合用于社交网络中的社区发现,引入模块度增量有助于提高算法的速度。 徐杨 蒙祖强关键词:社交网络 一种新的网络热点话题提取方法 被引量:6 2013年 网络热点话题提取是网络舆情分析的重要手段,已成为信息检索领域研究的热点内容之一.传统聚类方法因其聚类结果不允许相交等因素,暴露了其在基于(主题)词聚类进行话题发现中的诸多缺点.本文基于小世界理论建立词的共现网络模型并去除大量冗余词,然后运用极大相容块技术并基于过滤后的词共现网络实现对相交话题的提取,获取网络热点话题.本文方法与传统聚类方法有本质区别,基于(主题)词聚类进行话题发现具有独特的优势,较好克服了已有方法的缺点.实验说明了本文方法对提取网络热点话题是有效和可行的,比同类算法具有更好的性能,且具有较好的可伸缩性. 蒙祖强 黄柏雄关键词:词聚类 文本聚类 基于多线程技术的分辨函数析取范式生成算法 被引量:2 2013年 基于分辨矩阵计算信息系统的所有约简,都需要将合取范式转化为析取范式,但是该转化过程存在组合爆炸问题。为解决该问题,根据合取范式、合取运算和析取运算的特点,构建析取范式转化的并行模型,提出基于多线程技术的分辨函数析取范式生成算法,利用Windows的自动线程调度功能提高范式转换的效率。实验结果表明,该算法的析取范式转化效率会随着合取范式长度的增加而提高,适合在多核CPU计算机上运行。 蒙祖强 周石泉 黄柏雄关键词:属性约简 多线程技术 析取范式 基于时间依赖的物联网络模型的路径规划 被引量:2 2013年 本文针对基于物联网的物流网络中路径代价的时变性,建立一种时间依赖的物联网络模型,并在此基础上研究物流路径规划问题。针对现实中预测准确性随时间推移而降低,以及在预知程度较低时无法获得较好的路径规划等问题,提出一种带弧代价预知程度参数的最小时间路径算法SW PL以及基于SW PL的逐步规划解决方案。该算法考虑了预测的精度问题,在传统Dijkstra算法的基础上引入一种与时间相关的弧代价计算方法。实验表明,在预知程度较高和在预知程度较低但采用逐步规划的解决方案2种情况下,都能取得良好的路径规划效果。 杨俊瑶 蒙祖强关键词:物联网 路径规划 时间依赖网络