李弼程
- 作品数:309 被引量:1,643H指数:19
- 供职机构:华侨大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学理学更多>>
- 一种基于PCA和RS的文本过滤方法被引量:5
- 2005年
- 本文提出一种文本过滤方法,即首先利用PCA(主成分分析)的方法进行文本特征抽取,在此基础上运用RS中决策表上的规则推理方法,发现规则并形成规则库,对于新进来文档将其条件属性与规则库里规则进行相似匹配,进行文本过滤。实验结果表明,此方法用于垃圾邮件过滤能取得很高的正确率和召回率。
- 林琛李弼程宋辉
- 关键词:主成分分析粗糙集特征抽取文本过滤
- 基于类内方差归一化和SVM的说话人识别方法被引量:5
- 2009年
- 支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SVM的分类效果。实验表明,新方法是有效的,其性能优于基于GLDS核的SVM系统。
- 高新建李弼程屈丹
- 关键词:支持向量机
- 一种有效的基于内容的图像检索方法
- 文中提出了一种基于广义直方图的图像内容检索方法.首先,论文把图像和它的平滑图像组合起来,形成一个二元组,称之为“广义图像”,广义图像的直方图称为广义直方图;其次,把图像颜色空间聚类算法推广到广义图像;最后,利用传统直方图...
- 王禹李弼程郭志刚魏俊
- 关键词:颜色直方图广义图像广义直方图图像检索多媒体数据库
- 文献传递
- 基于信息粒度原理的垃圾邮件过滤方法被引量:4
- 2007年
- 信息粒度原理是一种从多个角度来精确描述对象的物理学方法。本文将信息粒度的原理应用到垃圾邮件的过滤中,提出了一种基于信息粒度原理的垃圾邮件过滤方法。通过对原始样本空间更精细的划分来实现对邮件类别的更准确描述。本文在Ling-Spam语料库上进行了试验,结果表明,新方法具有较高的分类精度和良好的处理速度。
- 盛亮李弼程林琛
- 关键词:信息粒度垃圾邮件过滤
- 一种集成浅层语义表示向量的深度学习文本分类方法
- 本发明公开了一种集成浅层语义表示向量的深度学习文本分类方法,方法包括:首先对文本语料训练词嵌入向量,其次利用领域词汇字典作为浅层语义词汇,基于浅层语义词汇,生成文本语料中每一个词的浅层语义向量表达。接下来将两个词向量进行...
- 王华珍李小整何霆贺惠新李弼程
- 文献传递
- 一种基于多模态融合的图像主题分类方法和系统
- 一种基于多模态融合的图像主题分类方法和系统,包括:通过数据预处理构建图像对应的叙事文本和概念文本;将图像及其对应的叙事文本和概念文本输入预训练的特征提取模型得到图像特征、图像概念文本特征和图像叙事文本特征;采用标签注意力...
- 李弼程许逸飞蔡博伟皮慧娟王华珍王成
- 基于距离度量学习的DCT域JPEG图像检索被引量:6
- 2014年
- 由于特征有限,传统基于欧式距离的压缩域检索性能并不理想。本文引入距离度量学习技术,研究压缩域图像检索,提出了一种基于距离度量学习的离散余弦变换(DCT)域联合图像专家小组(JPEG)图像检索方法。首先,提出了一种更有效的DCT域特征提取方法;其次,运用距离度量学习技术训练出一个更加有效的度量矩阵进行检索。在Corel5000上的图像检索实验表明,新方法有效提高了检索准确度。
- 吕清秀李弼程高毫林
- 关键词:图像检索离散余弦变换域
- VoIP压缩码流说话人识别研究被引量:2
- 2009年
- 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
- 唐晖李弼程屈丹张连海
- 关键词:说话人识别
- 基于段级特征的快速说话人识别算法及DSP实现
- 本文在TMS320C6701EVM板的基础上实现一种快速的说话人识别系统.提出一种基于段级语音特征的说话人识别的快速算法,该算法在传统的GMM算法的基础上使用段级语音特征对测试语音进行数据量压缩,以减少计算时间.并基于车...
- 王波徐毅琼李弼程
- 关键词:说话人识别数字信号处理芯片识别率
- 文献传递
- 声学模型区分性训练中的动态加权数据选取方法
- 2014年
- 提出了一种基于动态加权的数据选取方法,并应用到连续语音识别的声学模型区分性训练中.该方法联合后验概率和音素准确率选取数据,首先,采用后验概率的Beam算法裁剪词图,在此基础上依据候选词所在候选路径的错误率,基于后验概率动态的赋予候选词不同的权值;其次,通过统计音素对之间的混淆程度,给易混淆音素对动态地加以不同的惩罚权重,计算音素准确率;最后,在估计得到弧段期望准确率分布的基础上,采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明,与最小音素错误准则相比,该动态加权方法识别准确率提高了0.61%,可有效减少训练时间.
- 陈斌牛铜张连海李弼程屈丹
- 关键词:语音识别动态加权