柴玉梅 作品数:100 被引量:651 H指数:14 供职机构: 郑州大学 更多>> 发文基金: 国家自然科学基金 河南省自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 医药卫生 文化科学 语言文字 更多>>
并行计算中基于移动Agent的负载均衡策略 2004年 针对并行程序设计的五种模式中主从模式的不足 ,提出了基于移动 agent的负载均衡策略 .该策略对移动agent获取的数据进行分析 ,合理地分配各个结点的处理数据量 ,明显地减少了程序的运行时间 . 王黎明 赵中堂 柴玉梅关键词:并行计算 移动AGENT 负载均衡策略 一种图像分类方法 本发明提供了一种图像分类方法,尤其涉及关于概念认知在图像分类领域的应用方法。本发明是基于概念认知过程的图像分类方法分为两个模块:认知训练模块,用来学习图像概念,最终生成一棵概念树用来实现图像分类任务;图像分类模块,使用训... 申培正 张卓 王黎明 柴玉梅基于线性结构的逆向组合拍卖算法研究 被引量:1 2010年 对逆向组合拍卖的拍卖模型和WDP问题进行了研究,报告了当前逆向组合拍卖的研究现状,分析了对称关联价值模型的基本性质。结合对称关联价值模型分析了WDP的形式化描述,在此基础上提出了基于线性结构的饱和分割区近似算法(LISAPA)。该算法避免了项目组合树的建立,并且可以在构造过程中直接由局部最优解扩展到全局最优解,从而显著的提高构造效率。实验结果表明,当拍卖项目组合数大于拍卖项目数时,该算法能够解决中标者确定问题,并且有较好的达优率。 柴玉梅 岳昌应 王黎明关键词:最优解 基于助词用法的汉语词性、分词错误自动发现 被引量:3 2011年 在构建助词知识库、标注大规模语料过程中使用了基于规则的助词用法自动标注的方法;对标注后的语料,发现基于规则的助词用法自动标注方法能够自动发现语料的部分词性、分词错误。这些错误的发现对研制高质量的语料库起到了积极的促进作用,并将语料加工深度向前推进。 韩英杰 张坤丽 昝红英 柴玉梅关键词:用法 一种改进过采样的不平衡数据集成分类算法 被引量:10 2018年 不平衡数据分类是机器学习和数据挖掘的重要环节.类分布不均衡和类中"困难样本"会导致许多传统分类算法效果不理想.为此,本文提出一种改进过采样的不平衡数据集成分类算法,一方面利用多数类样本划分少数类样本为不同子簇,充分考虑类间与类内数据的不平衡,根据子簇的概率分布进行过采样,并且对过采样后的样本及时进行修正,保证合成样本质量;另一方面利用AdaBoost算法处理不平衡数据的优势,采用决策树作为基本分类器,在每次迭代初始利用过采样方法合成样本,平衡训练信息,得到最终分类模型. 7组UCI数据实验表明改进过采样的不平衡数据集成分类算法可以显著提高分类的精度,进而提升分类器的性能. 张菲菲 王黎明 柴玉梅关键词:不平衡数据 概率分布 过采样 ADABOOST 关于模糊概念的一种基于负载均衡的并行生成方法 本发明公开了关于模糊概念的一种基于负载均衡的并行生成方法,步骤一,根据所要处理的数据集和精度要求,生成模糊形式背景<Image file="DEST_PATH_IMAGE001.GIF" he="7.41" imgCon... 张卓 杜鹃 王黎明 柴玉梅文献传递 基于深度学习的微博情感分析 被引量:110 2014年 中文微博情感分析旨在发现用户对热点事件的观点态度。已有的研究大多使用SVM、CRF等传统算法根据手工标注情感特征对微博情感进行分析。该文主要探讨利用深度学习来做中文微博情感分析的可行性,采用递归神经网络来发现与任务相关的特征,避免依赖于具体任务的人工特征设计,并根据句子词语间前后的关联性引入情感极性转移模型加强对文本关联性的捕获。该文提出的方法在性能上与当前采用手工标注情感特征的方法相当,但节省了大量人工标注的工作量。 梁军 柴玉梅 原慧斌 昝红英 刘铭关键词:递归神经网络 基于多Agent的分布式数据挖掘模型 被引量:21 2004年 论文分析了分布式数据挖掘的优势和所面临的问题,讨论了Agent对分布式数据挖掘性能的增强。又进一步提出了一个基于Agent的分布式数据挖掘形式模型,并结合数据挖掘方法和知识集成技术对该模型进行了深入的分析和讨论。 王黎明 柴玉梅 黄厚宽关键词:分布式数据挖掘 AGENT 知识集成 模糊形式概念并行构造算法 被引量:6 2013年 形式概念分析理论已经广泛地应用于计算机诸多领域.当前,模糊概念格直接构造仍然是该领域主要问题之一,其构造过程具有指数级时间复杂度.为了提高模糊概念格构造效率,文中对串行模糊概念构造算法进行并行化改进,将模糊集合组合搜索空间映射为自然数区间,简化了搜索空间表示、划分和遍历过程,进而提出并行模糊概念构造算法(Parallel Fuzzy Next Closure,ParaFuNeC).该算法对搜索空间均匀划分,子搜索空间彼此独立,从而避免并行任务之间同步、通讯等时间耗费,达到提高模糊概念构造效率的目标.时间复杂度分析和实验结果表明该算法在大规模计算任务情况下,加速比随着并行度的提高呈正比增长趋势.另外,串行比例指标表明ParaFuNeC算法在大规模计算任务情况下具有更好的可扩展性. 张卓 柴玉梅 王黎明 范明关键词:模糊集 中英文双语术语抽取相关技术研究 昝红英 张坤丽 柴玉梅 穆玲玲 赵丹 马玉汴 于颖 术语抽取是自然语言信息处理中的重要研究问题,在很多领域都有广泛的应用,如自然语言生成、计算词典编撰学、句法分析、语料库语言学的研究、统计机器翻译、信息检索、文本分类、文本摘要等领域。 随着社会的发展和科技的进步,语言也...关键词:关键词:术语抽取 中英文 法律术语