何云
- 作品数:8 被引量:17H指数:2
- 供职机构:南开大学更多>>
- 发文基金:天津市信息化项目天津市科技发展战略研究计划项目更多>>
- 相关领域:自动化与计算机技术经济管理电子电信更多>>
- 基于改进贝叶斯模型的中文邮件分类算法被引量:12
- 2006年
- 通过分析常见的贝叶斯分类方法和实现模型,提出了一种适用于中文邮件的分类算法——基于混合模型的最小风险贝叶斯方法。混合模型将二项独立模型和多项式模型相结合,提高邮件分类的查全率,同时,在此基础上应用最小风险贝叶斯方法,进一步提高准确率。实验表明,应用改进的方法可以得到更准确的邮件分类效果。
- 王宁张建忠何云申庆永徐敬东
- 关键词:邮件分类中文分词混合模型贝叶斯
- 基于Linux防火墙的内部邮件监控系统被引量:1
- 2006年
- 给出了一种分布式邮件监控系统的设计和实现方案。该方案的实现建立在Linux防火墙的基础上。采用了Netfilter构架中的ip_queue机制获取流经网关的邮件,根据SMTP和POP3的协议特点提取邮件内容,利用文本分类技术对邮件内容进行监控。系统中广泛地使用了插件机制,明确地划分了实时处理和离线分析两大类操作的界限。针对文本分类器的特点,系统定义了简明的接口,使不同算法的分类器可以方便地整合到系统当中来。该方案的实施可以有效地监控流经网关的邮件。
- 赵奇张建忠何云吴功宜
- 关键词:防火墙网络监控LINUX文本分类NETFILTER
- 基于Milter实现的中文垃圾邮件过滤系统
- 2007年
- 提出一种基于内容的中文垃圾邮件实时过滤系统的实现方案,该系统建立在Linux的Sendmail邮件服务器上,通过Milter接口实时提取邮件内容,并结合中文分词及文本分类算法对邮件实施分类和过滤。该系统可嵌入多种文本分类算法,具有良好的可扩展性。通过测试对该系统内嵌入的不同分类算法模型进行了分析和比较。
- 杨洁张建忠申庆永何云
- 关键词:邮件分类中文分词贝叶斯算法K近邻算法
- 智能小区监测和控制系统中无线个域网的设计与实现
- 物联网被称作继计算机、互联网之后世界信息产业发展的“第三次浪潮”。智能小区监测和控制系统是物联网的一种重要的应用领域,为了实现小区的各种监控设备的智能管理,将各个设备通过无线的方式联成一个个域网,本文根据这种需求设计和实...
- 何云
- 关键词:无线个域网ZIGBEE技术网络节点物联网
- 一种高效的无结构对等网查询机制
- 2007年
- 提出一种提高无结构型对等网络查询效率的机制。在该机制下,节点根据地理位置自动聚类,类之间用Chord方式组合起来,从而减轻了逻辑网络与物理网络拓扑结构的不匹配。为了进一步提高查询效率,引入了一种类间索引技术。该技术使得查询消息不需要遍历所有的类就能获得全局搜索结果。与Gnutella中的洪泛滥查询相比,在TTL=5的情况下,该机制最多能减少超过80%的资源开销,最多可以将响应时间缩短59%。
- 赵奇陈燕何云徐敬东
- 关键词:对等网络查询机制聚类索引
- 我国上市公司财务预警模型的研究
- 何云
- 关键词:上市公司财务危机财务预警模型
- P2P文件共享网络中的可扩展性问题的研究
- 在过去的几年里,以Gnutella和KaZaA为代表的文件共享网络已经成为Internet上增长最迅速的应用。这种运行于多个对等结点之上的逻辑网络被称为对等网络(P2P网络)。在这样的网络里,数据在结点之间直接传递,所有...
- 何云
- 关键词:对等网络可扩展性P2P文件共享网络
- 文献传递
- 中文垃圾邮件过滤系统中的实时分词算法设计被引量:4
- 2007年
- 在基于内容的中文反垃圾邮件技术中,中文分词是必不可少的一个环节。面对大规模的邮件训练样本和大负载的邮件服务器,中文分词算法的时间效率成为中文垃圾邮件过滤技术中的一个瓶颈。对此,提出一种应用在中文垃圾邮件过滤系统中的实时分词算法。该算法采用一种TRIE树型结构作为词典载体并基于最大匹配的原则,同时,在实时分类阶段结合hash表进行特征查询,极大地提高了系统的时间效率。
- 申庆永张建忠何云杨洁
- 关键词:中文分词垃圾邮件TRIE树