搜索到15162篇“ 文本相似度计算“的相关文章
基于知识图谱和对比学习的遥感文本相似计算方法
本发明公开了基于知识图谱和对比学习的遥感文本相似计算方法,涉及遥感科学与自然语言处理技术领域,包括从遥感领域数据网站和期刊文章中收集数据,构建遥感知识图谱并训练简单对比学习词嵌入模型,基于遥感知识图谱和简单对比学习词嵌...
赵萍吴松申奥楚博策朱进王梅瑞周俊常杰
文本相似计算模型生成方法、装置、设备及存储介质
本申请涉及计算机技术领域,本申请提供一种文本相似计算模型生成方法、装置、设备及存储介质,所述方法获取样本数据集对应的第一样本类别向量,并将第一样本类别向量进行归一化运算,生成第二样本类别向量;获取目标语句对应的第一句向...
田兴黄忠品
语义文本相似计算方法研究综述
2024年
语义文本相似计算是自然语言处理领域一个关键任务,旨在衡量两个文本之间的语义相似。对以往经典和当前主流的语义文本相似计算方法进行归纳和总结,将这些方法划分为传统的方法和基于深学习的方法两大类。传统的方法又划分为基于字面匹配、基于统计和基于规则的方法。基于深学习的方法又划分为基于词嵌入、基于句向量和基于预训练模型的方法。在进一步细分每个类别的基础上,详细介绍了各子类的典型方法,并对各种方法的基本思想、优点和局限性进行了深入分析和总结。最后,对语义文本相似计算方法可能的发展方向进行了展望。
李莹伍胜徐聪尹刚张锦
关键词:文本相似度语义相似度自然语言处理
学习中文本相似计算研究综述
2024年
文本相似计算是自然语言处理的重要任务之一,通过总结分析学术界提出的经典方法和最新进展,对深学习中文本相似计算文本表示和相似计算两个模块进行分类整理和全面综述。社交网络的发展衍生出了短文本相似计算这一重要子任务,因此针对每一模块,梳理文本相似计算相关技术与理论基础,总结其在短文本中的具体应用及改进;整理文本相似计算领域的常用数据集及评价指标;讨论文本相似计算未来可能的发展方向。
徐传丽周世杰吴春江
关键词:文本表示文本相似度自然语言处理神经网络
一种长文本相似计算方法、装置及介质
本发明提供了一种长文本相似计算方法、装置及介质,其方法步骤包括:对待比较的各个长文本分别进行文本分割,获取各个所述待比较长文本分别对应的多个子文本;获取各个所述子文本对应的多维向量;将所述多维向量拼接为与各个所述待比较...
梁铮杜渂石健文何之栋杨博王聚全穆青索涛赵福旺符承鹏陈浩李志渊刘朝政夏禹鹏周倡弘程铭翰王衍海
基于Bert模型的文本相似计算方法和装置
本发明公开了一种基于Bert模型的文本相似计算方法、装置、计算机设备及存储介质,涉及人工智能技术领域。该基于Bert模型的文本相似计算方法包括:确定待比对文本句段;采用词频词现率算法,基于待比对文本句段得到第一文本矩...
周宸 骆加维 周宝 陈远旭
文本相似计算方法、装置、电子设备及存储介质
本申请适用于自然语言处理技术领域,提供一种文本相似计算方法、装置、电子设备及存储介质,方法包括:获取需要进行相似计算的两个文本;利用高斯核函数对所述两个文本分别进行特征提取,获取所述两个文本各自对应的文本特征;根据所...
刘志慧金培根陆林炳林加新李炫
多角增强网络的语义文本相似计算方法
本发明关于一种多角增强网络的语义文本相似计算方法,包括:对中文文本进行分词,使用字符嵌入和词嵌入获得文本表示,在语料库中训练字符嵌入与词嵌入;融合字符嵌入与词嵌入获得融合向量,使用Bi‑SRU对融合向量进行编码;使用...
章涵博黄静马柯宇
一种文本相似计算方法、装置、电子设备及存储介质
本发明实施例公开了一种文本相似计算方法、装置、电子设备及存储介质,所述方法包括:根据两个待匹配文本句中相同词的个数、每个词在每个待匹配文本句中出现的次数以及所述每个词的词性权重计算所述两个待匹配文本句的句型相似;根据...
徐乐乐
一种文本相似计算去重方法、系统、介质及设备
本发明公开了一种文本相似计算去重方法、系统、介质及设备,将热线文本数据集导入数据库,并输入训练好的模型中进行特征提取,特征融合和特征增强,得到数据的最终特征并序列化保存;输入待计算数据到模型中提取最终特征;与相应日期内...
韩召宁 赵国帅 罗一玲 钱学明

相关作者

周兰江
作品数:94被引量:118H指数:7
供职机构:昆明理工大学信息工程与自动化学院
研究主题:老挝语 词性标注 机器学习技术 双语语料库 词性
李琼
作品数:34被引量:116H指数:6
供职机构:华中师范大学国际文化交流学院
研究主题:非分句 自动识别 支持向量机 语义 SVM
何明
作品数:26被引量:175H指数:5
供职机构:北京工业大学
研究主题:协同过滤 推荐系统 粗糙集 LDA GIBBS抽样
陈利
作品数:52被引量:147H指数:7
供职机构:华中师范大学计算机学院
研究主题:软件体系结构 ADA 操作系统 并发程序 软件工程
李艳梅
作品数:4被引量:112H指数:2
供职机构:华北电力大学
研究主题:文本相似度 VSM 文本相似度计算 基于文本 文本聚类