汪洋
- 作品数:8 被引量:23H指数:3
- 供职机构:烽火通信科技股份有限公司更多>>
- 发文基金:江苏省科技支撑计划项目更多>>
- 相关领域:自动化与计算机技术电子电信政治法律更多>>
- 基于KNN技术的校内网验证码识别被引量:12
- 2017年
- 随着科技日新月异的发展,验证码技术在网络防护和信息安全方面有着广泛的应用。由于网络攻击手段的提升,验证码技术也在改进。本文采用的校内网验证码是当前网络中最普遍的字符验证码类型,它多元化的背景噪音和字符扭曲粘连的特点,使得验证码很难实现程序自动识别。针对这些特点,本文在背景去噪阶段,提出RGB三原色去噪法;在单个字符切割阶段,采用轮廓差投影法与水滴算法相结合的分割方法。最后得到所有字符模型,再利用KNN算法,进行字符识别,从而得到识别结果。实验结果表明,该方法对有背景噪声和字符扭曲粘连的验证码有很好的识别效果。
- 汪洋许映秋彭艳兵
- 关键词:验证码KNN
- 模糊时间序列模型在论域划分上的研究
- 2015年
- 模糊时间序列的研究方向主要是围绕论域划分和模糊关系表示2个方面。首先,本文针对模糊时间序列模型中多尺度比率的论域划分方法存在的问题,提出用相邻数据相对误差的几何平均代替算术平均的方法,以提高模糊区间的精度和预测的准确度;其次,针对周期性的时间序列,采用连续时间的观测值表示模糊逻辑关系将存在很大的预测误差,使用以周期为间隔的时间序列的观测值来表示模糊逻辑关系,此方法不仅简化了模糊关系矩阵,而且降低了算法复杂度;最后,通过重庆某网吧客流量的预测,验证此方法的有效性。
- 汪洋陈海燕彭艳兵
- 基于离散载荷特征的即时通讯软件流量分类方法
- 2020年
- 随着大数据时代到来,海量即时通讯软件流量分类成为解决网络拥塞、安全监管、网络异常检测等研究的基础。针对传统流量识别与分类技术准确率低、速率慢等问题,文章提出一种基于离散载荷特征的即时通讯软件流量分类技术。该技术通过对通讯软件报文数据进行五元组数据提纯,利用信息熵对载荷特征进行离散化,结合XGBoost构建通讯软件数据报文的二分类模型,同时将其效果与随机森林、SVM和朴素贝叶斯的方法做对比试验。结果表明,这种方法较传统流量分类方法准确率提高4.3%,与采用连续特征分类相比分类准确率提高2.3%,同时具有处理速度快、适用性广泛的特点。
- 崔弘蒋言郭士串汪洋
- 关键词:信息熵
- 基于Trie树和有限状态自动机的中文地址解析模型被引量:3
- 2016年
- 目前,无论是在研究或者是商业领域中,中文地址解析都没有一个成熟的模型结果。要素识别是地址解析的关键技术,传统的地址要素识别是基于特征词和字典匹配的方法,难以解决地址命名的多样性问题。利用自然语言处理技术,根据Trie树模型对行政区域寻址的方法和有限状态自动机模型对非规范地址的要素提取方法,本文提出T-FA模型对地址进行分级划分。其中,采用隐马尔可夫模型的切词方法和最长公共子序列算法,可以解决地址要素识别的模糊化搜索。T-FA模型具有良好的泛化能力,在批量处理地址时具有很好的通用效果,能比较有效地解决中文地址多样化的解析难题。
- 汪洋刘师培王峥
- 模糊时间序列模型在论域定义上的研究被引量:4
- 2017年
- 文中基于模糊时间序列模型,提出了如何定义论域的方法。预测人员在不断地应用模糊时间序列模型进行预测的同时,也对此模型进行了不同方面的改进,但是大部分主要包括两个方面:一是论域划分,而是模糊关系表示。在论域划分上面,现有的研究都是简单的向上和向下取整的方法,没有意识到论域区间的定义也会影响到预测的结果的原因,所以本文研究了新的定义论域区间的方法,本文新的方法中提出论域区间的定义和当前类别的数据分布有关,这样充分考虑了样本数据的分布情况,提高了论域间隔的准确度和可解释性。最后,本文应用阿拉巴马州大学的预测结果和最新的论域划分方法进行了比较,结果表明了此方法的有效性。
- 汪洋陈海燕彭艳兵
- 关键词:数据分布
- 基于Solr的混合介质存储在淘宝系统中的研究与应用被引量:1
- 2017年
- DT时代已经来临,开源搜索引擎已经成为各大公司检索海量数据的主流,其中Solr以其支持多种格式索引,高效性,高灵活性,高可扩展性,深受广大爱好者以及各大公司青睐,本文基于提高Solr检索速度和对数据管理便捷性,提出了混合介质存储分盘管理查询并且设置优先级异步并发的改进方案,通过在淘宝用户评论检索中的研究与应用,证实了方案能够极大优化了性能并且提高检索速度。
- 汪洋崔炜
- 关键词:LUCENESOLR
- 无线城市数据中的社团发现方法被引量:3
- 2016年
- 为了在缺失社交关系的无线城市接入日志中挖掘频繁共现的社团结构。提出了一种基于无向有权图的社团发现方法:团搜索(Clique Search)。该算法将日志数据映射到图空间,通过挖掘其中的团来对潜在的社团关系进行挖掘。相较于传统算法,该算法显著减小了运算时间复杂度与空间复杂度。实验结果表明,随着输入数据集规模的增长,该算法仍然能够在常数级别时间内完成计算。算法中的参数δ对结果社团中成员的联系紧密度影响比较明显,使用不同的δ值可以满足不同应用的需求。
- 马威汪洋彭艳兵
- 关键词:无线城市社团发现MAC地址APRIORI算法