廖文婧 作品数:12 被引量:14 H指数:2 供职机构: 贵州财经大学信息学院 更多>> 发文基金: 贵州省科技计划项目 更多>> 相关领域: 自动化与计算机技术 文化科学 艺术 经济管理 更多>>
基于边界支持向量的自适应增量支持向量机 2014年 该文提出一种基于边界支持向量的自适应增量支持向量机,对每轮训练的样本集提取其边界支持向量,从而减少训练向量数目,提高训练效率.通过自适应调整参数,可以更好地适应新增样本.采用UCI(University of California Irvine)机器学习数据库和Statlog数据库对本文方法进行验证,实验结果表明本文方法的训练时间优于标准支持向量机和一般增量支持向量机.其分类精度也明显优于一般增量支持向量机,在训练数据较少时,其分类精度与标准支持向量机相差不大,但随着训练数据的增加,分类精度逐渐超越标准支持向量机.该文的方法更适合大规模数据集的增量学习. 廖文婧关键词:数据挖掘 支持向量机 自适应 基于LDA和关系图谱的数据治理文献主题演化研究 被引量:2 2022年 针对数据治理领域缺乏深层次的主题挖掘,未有效结合机器学习算法开展主题演化研究,无法精准感知数据治理的变化趋势及主题演化规律问题,提出了一种基于LDA模型和关系图谱的数据治理文献主题演化算法。首先,利用LDA模型和层次聚类算法梳理数据治理的核心主题;其次,结合文本特征和群体特征开展主题关系图谱及科研群体发现研究;最后,通过计算主题消融权重实现数据治理主题演化感知分析。实验结果表明,文章提出的方法能有效挖掘数据治理文献的主题,梳理该领域知识的发展态势,确定未来的研究趋势和热点,为数据治理领域的发展提供了理论基础和研究思路。 杨秀璋 武帅 宋籍文 廖文婧 任天舒 刘建义关键词:文本挖掘 LDA模型 基于改进图像增强及CNN的复杂环境车牌识别算法 2024年 传统图像识别和深度学习模型较难检测复杂环境下的车牌,其场景适用性和精确率较低,从而严重威胁交通安全,影响智慧交通发展。基于此,文中提出了一种基于改进图像增强及CNN的复杂环境车牌识别算法。首先,结合目标图像的平均灰度值,利用ACE算法和暗通道先验去雾算法对复杂环境下的车牌数据集进行图像增强;然后提出了一种融合色彩关键特征和波峰关键特征的车牌区域定位算法,通过8个核心步骤有效定位复杂环境下车牌的区域;最后构建五层卷积神经网络的模型,以实现车牌字符识别。实验结果表明,所提算法能有效识别复杂环境下行驶车辆的车牌,该算法在复杂环境车牌区域定位的精确率为86.04%,召回率为82.60%,F 1值为84.29%,其F 1值比传统图像处理算法提升了47.29%,比SSD算法提升了24.73%,比YOLO算法提升了26.37%,比YOLOv3提升了17.15%。同时,所提方法的时间复杂度较低,属于一种轻量级的车牌识别方法,能消除噪声并实现车牌字符识别,具有一定的应用前景和实用价值,也将为智慧交通的研究提供理论基础。 杨秀璋 武帅 任天舒 廖文婧 项美玉 于小民 刘建义 陈登建关键词:车牌识别 图像增强 复杂环境 智慧交通 融合多头注意力机制和BiLSTM的电商评论情感分析研究 被引量:1 2022年 针对电商评论数据缺乏深层次的情感分析和语义知识关联,不利于系统挖掘潜在的消费情感和客户满意度信息问题,以京东电商评论数据为例,提出一种融合多头注意力机制和双向长短时记忆网络模型(bi-directional long short-term memory,BiLSTM)的电商评论情感分析模型。首先,通过词嵌入将文本数据转化为句向量;其次,构建融合多头注意力机制的BiLSTM模型,利用BiLSTM捕获长距离依赖关系,利用Transformer突出全局关键特征;最后,构建分类器实现电商评论的情感分析。实验结果表明,文章提出方法优于现有的机器学习和深度学习方法,其F_(1)值为0.9276。同时,通过详细的对比实验证明了该方法能实现评论文本情感特征的细粒度提取,并能在少样本标注的情况下取得更好的准确率,具有良好的鲁棒性和准确性。 杨秀璋 武帅 任天舒 刘建义 宋籍文 廖文婧关键词:情感分析 一种改进的复杂环境下条形码图像增强和定位算法 被引量:2 2020年 针对目前物流出库以传统的扫码枪识别,无法完成对条形码的自动化定位,导致其出库效率不高,同时快递单的拍摄环境比较复杂,现有条形码定位算法难以满足生产中的需求。提出一种改进的复杂环境下条形码图像增强和定位算法,通过色彩自动均衡化算法增强复杂环境下的一维条形码图像,引入基于HOG和SVM的条形码图像特征学习与定位算法,并结合实际情况构建适用性更强的图像定位算法,对定位像素溢出问题进行改进和优化。采用Python和OpenCV进行仿真对比实验,实验结果表明该算法能有效地对复杂环境下的条形码进行增强和定位,过滤掉噪声的同时精确地识别出条形码,提高条形码图像的定位效率和识别成功率。在一定程度上提高物流行业的条形码扫描效率,具有较强的鲁棒性和准确性,可以广泛应用于条形码图像识别领域,并能够适应诸多环境下的条码定位和识别,具有一定的应用前景和使用价值。 廖文婧 杨秀璋 吕询 敖进 范郁锋 于小民 赵小明关键词:图像增强 图像定位 条形码识别 复杂环境 一种自适应图像增强和AlexNet的水书古文字识别算法 被引量:2 2023年 针对水族古文字受字形变化、年代噪声影响,无法实现高质量数字化提取,且缺乏利用深度学习技术实现对水书古文字的自动化识别问题,提出了一种自适应图像增强和AlexNet的水书文字识别算法,通过优化模型识别复杂环境下文字的关键特征,实现水书古文字智能识别以及同汉字的自动翻译。首先,采集具有代表性的水书古文字并进行数据标注处理,通过图像变换算法扩充数据集;其次,计算各种场景的图像噪声阈值,构建自适应图像增强的去噪算法;最后,构建AlexNet神经网络模型实现水书古文字的自动识别。实验结果表明,提出的算法能有效识别复杂环境下的水族古文字,其精确率、召回率和F1值分别为0.9755、0.9743和0.9743,能为少数民族文字识别、古籍文字自动提取及少数民族古文字与汉字的自动翻译提供有效支撑,具有一定的学术价值和应用前景。 杨秀璋 武帅 宋籍文 廖文婧 周既松复杂环境下自适应去雾的YOLOv3汽车识别算法 被引量:3 2023年 复杂环境因素会严重影响道路汽车目标检测算法的性能,传统方法识别精度较低且感知慢,严重威胁交通安全,为此提出一种融合自适应图像去雾的YOLOv3汽车识别算法。首先,在图像预处理阶段构建自适应图像去雾算法,融合ACE去雾算法和暗通道去雾算法,有效降低雨雾图像噪声;其次,利用改进的YOLOv3算法识别和定位汽车位置;最后,通过详细的对比实验证明方法的有效性,并准确识别出复杂天气中行驶的车辆。实验结果表明,所提方法能有效降低雨雾情况下的噪声,对行驶车辆进行有效定位,其精确率、召回率和F1值分别为0.944,0.934和0.939,均高于传统SSD,YOLO和YOLOv3算法,并且具有较好的鲁棒性和速度,这将为智慧交通的发展提供理论基础并具有实践意义。 杨秀璋 武帅 李娜 杨雯雯 廖文婧 周继松数智赋能视域下侗族大歌主题挖掘及演化分析研究 2023年 针对新范式对传统人文社科造成学科边界模糊的问题,提出一种基于LDA模型和关系图谱的领域主题演化算法。首先运用综合指数确认领域核心研究人员;再利用LDA模型和层次聚类确认领域划分的主题数,构建关系图谱,探究主题词关联性;最后创新性的提出演化各主题间的关联性。实验将侗族大歌领域分为三个主题,并演化出他们之间的联系。该研究可为数智赋能语音音频的深入研究提供基础。 杨秀璋 武帅 项美玉 廖文婧 任天舒 刘建义关键词:侗族大歌 车辆碰撞信号插值补偿算法仿真 被引量:1 2013年 为了解决由于车辆碰撞造成的道路拥堵、连续追尾事故的发生,研究了车辆碰撞信号检测方法,以Q-L在线进化学习的车辆碰撞信号插值补偿算法为估算方法对车辆的行驶状态进行碰撞系数计算,通过在线进化的最优近似算法来寻找当前车辆行驶状态的最优插值数据区间,寻找具有最优反馈值和评价函数值的执行状态参数,从而得到车辆碰撞参数。以车辆碰撞测试中的碰撞数据和正常数据进行融合,作为仿真的输入数据,在不同信噪比下对算法的有效性进行仿真,结果表明,插值补偿算法具有较好的鲁棒性,检测率较高,误报率较低。 廖文婧关键词:车辆碰撞 进化学习 基于LDA⁃BiLSTM模型和知识图谱的电影影评文本挖掘研究 被引量:1 2023年 针对传统方法仅从宏观层面对电影产业和影评进行计量统计和文字描述研究,无法有效挖掘高质量电影的主题和观众的评价,缺乏深层次的语义知识挖掘,提出一种基于LDA⁃BiLSTM模型和知识图谱的电影影评文本挖掘方法。首先,采集《你好,李焕英》电影的影评文本并进行预处理;其次,抽取影评的共现特征词,利用知识图谱挖掘电影质量及口碑相关特征词的关联关系,深入分析高质量电影的影响因素;最后,构建LDA⁃BiLSTM模型实现影评的情感分析,通过LDA模型提取影评的关键特征词,利用长短时记忆网络捕获长距离依赖关系,从而精准预测影评情感类别。实验结果表明,提出的方法能有效挖掘电影影评的情感特征词和关联关系,所提出LDA⁃BiLSTM模型的精确率、召回率、F1值和准确率依次为0.9839、0.9805、0.9822和0.9805,其结果优于其它机器学习和深度学习模型,为我国高质量电影挖掘提供学术思路,具有一定的研究价值。 杨秀璋 武帅 廖文婧 项美玉 于小民 周既松 赵小明关键词:文本挖掘 知识图谱 电影分析