江苏省自然科学基金(BK2003030)
- 作品数:27 被引量:117H指数:7
- 相关作者:朱巧明李培峰吕强钱培德周蕾更多>>
- 相关机构:苏州大学江苏省计算机信息处理技术重点实验室常熟理工学院更多>>
- 发文基金:江苏省自然科学基金江苏省教育厅自然科学基金江苏省高技术研究计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据缺失下学习贝叶斯网的一种混合启发方法被引量:1
- 2008年
- 建立了具有数据缺失训练集下学习贝叶斯网的一种混合启发方法:SGS-EM-PACOB算法。它基于打分-搜索方法,利用GS和EM数据补全策略分别得到学习所需要的统计因子,并将两者联合起来作为PACOB算法的启发因子。实验证明,SGS-EM-PACOB算法充分保留GS和EM两者的优点,促使算法能够平稳地收敛到理想结果。相对于只具有单一数据补全策略的算法,该算法不仅在度量数据拟合程度的Logloss值上保持稳定,而且在学习到的贝叶斯网络结构上也有改进。
- 廖学清吕强
- 基于统计和规则的未登录词识别方法研究被引量:25
- 2007年
- 介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组)。实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%。
- 周蕾朱巧明
- 关键词:未登录词识别贪心算法互信息
- 一种数据缺失下贝叶斯网络增量学习的有效方法被引量:5
- 2010年
- 提出一种在数据缺失下增量学习贝叶斯网络的有效算法IBN-M。IBN-M用结构化的EM算法来补全数据集中缺失的数据,并且能在并行和启发式搜索策略提供的较大的搜索空间里搜索,有效地避免了采用结构化EM算法而导致的局部极值。同时采用增量学习的方法,解决了大规模数据学习存在的内存空间不足的问题。实验结果表明IBN-M算法在数据缺失下贝叶斯网络的增量学习中确实能够学出相对精确的网络模型。
- 李亚飞吕强单冬冬王磊
- 关键词:贝叶斯网络缺失数据
- 基于RBAC4WS的Web应用集成技术被引量:1
- 2006年
- 本文在分析了企业分布式Web应用集成技术的基础上,提出了一个基于角色访问控制模型的扩展模型RBAC4WS。同时,文章提出了基于RBAC4WS的Web应用集成平台的设计方案,重点讨论了用户管理和授权管理在分布式环境中的实现方法,为Web应用系统集成中实现单点登录提供了一条有效的途径。
- 张苏李培峰朱巧明
- 关键词:WEB应用系统单点登录系统集成
- 结合Condor-PVM与Globus的并行计算机制
- 2008年
- 首先分析了在网格上用C语言实现分布式并行计算的两种已有方案,然后提出一个Condor-PVM与GT4(Globus ToolkitVersion 4)结合的改进方案,利用PVM(Parallel Virtual Machine)并行消息传递机制实现主从作业之间的通信,同时充分利用GT4的网格资源和安全机制及Condor的调度管理。最后给出该方案在分词服务网格平台上的实现过程。
- 郭翠珍朱巧明李培峰钱培德
- 关键词:GT4
- 基于Pocket PC的汉字输入系统的设计与实现被引量:4
- 2006年
- PocketPC是PDA中最常用的操作系统.本文分析了PocketPC的输入机制,并在此基础上从系统构架和输入码对照表结构这两个方面设计了一个基于PocketPC的汉字输入系统,该系统具有简繁通用、检索效率高等特点.另外,本文还描述了在系统设计和实现中的一些关键技术.
- 李培峰朱巧明钱培德
- 关键词:输入接口POCKETPC
- 面向Web应用集成的统一授权平台的设计与实现被引量:6
- 2006年
- 每个应用系统都会有一个访问控制模块,分散的访问控制管理会导致访问控制策略不统一和数据冗余等问题。提出了一种基于Web服务的面向Web应用集成的统一授权平台,该平台用于实现用户信息的集中存储和分布管理,以及统一的访问控制管理。该方案不仅可以提高应用系统的安全性而且可以减轻系统维护和系统开发的工作量,是开发“一站式”信息共享平台的基础设施。
- 张苏李培峰杨季文朱巧明
- 关键词:访问控制WEB服务
- 一个面向信息处理的双向文字处理算法IBidi被引量:2
- 2007年
- 根据多文种信息处理中双向文字所存在的问题,提出了一种面向信息处理、具有自描述能力的双向文字处理算法IBidi。该算法首先对字符流进行预处理,主要对数字等特殊的字符进行标注;然后分析字符流,添加各种定义好的标签,用于描述字符的特性,供信息处理系统使用;最后,IBidi利用一个重新排序算法输出处理结果。该算法在典型测试样本上正确率达到96.7%,比Unicode的双向文字处理算法高出约17个百分点。另外,在随机样本测试中,IBidi的正确率也比Unicode的双向文字处理算法高5%左右。
- 李培峰朱巧明钱培德
- 关键词:标签
- 基于最大熵模型的邮件过滤系统研究被引量:1
- 2006年
- 将最大熵模型引入到邮件过滤中,结合邮件的半结构化特性,给出改进的特征函数定义,形成邮件特征向量。在此基础上,构造出基于最大熵模型的邮件过滤系统的基本框架。实验结果表明,这种过滤方法在召回率、准确率等方面表现出了良好的性能。
- 司广涛李培峰朱巧明李军辉
- 关键词:最大熵模型特征提取邮件过滤
- 一个应用于手持设备的汉字通用输入模型被引量:5
- 2006年
- 分析了现有汉字输入模型应用在手持设备时存在的缺点,提出了一个能适用于各种手持设备的汉字通用输入模型。该模型由通用引擎接口层、通用输入流处理层与通用数据处理接口层组成,其框架采用面向对象技术设计,能支持多种手持设备操作系统,并具有良好的通用性、透明性和可扩展性;介绍了模型各个层的功能以及具体的设计技术;说明了模型中各层之间的协作关系。
- 李培峰朱巧明钱培德
- 关键词:汉字输入