李哲
- 作品数:7 被引量:8H指数:2
- 供职机构:新疆大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学文化科学更多>>
- 艾比湖湿地自然保护区不同季节盐生植物光谱特征研究
- 盐生植物是西北干旱区重要的生命支持系统,对于维持新疆-盐渍土-绿洲生态系统平衡,促进绿洲农业经济发展、改善生态环境具有积极作用。艾比湖湿地自然保护区盐生植物群落的区域或景观生态环境研究需要准确的数据源,高光谱数据在光谱信...
- 李哲
- 关键词:BP神经网络植被指数
- 文献传递
- 一种知识感知的情感分析方法
- 本发明提供了一种知识感知的情感分析方法,属于人工智能领域,包括:收集自然语言解释e<Sub>i</Sub>,并利用语义解析器将收集的自然语言解释e<Sub>i</Sub>生成一系列候选标签函数;将候选标签函数输入到过滤器...
- 柯尊旺李哲刘士坤代立韩华伟
- 文献传递
- 基于多亚词序列融合的神经机器翻译
- 2023年
- 在神经机器翻译模型中,BPE(Byte Pair Encoding)方法用于解决模型不能正确翻译罕见词和不可见词的问题。但是BPE只能将单词切分成唯一的亚词序列,面对形态丰富的语言,同一个词存在多种不同的组合,但是模型只能学习单词的一种组合方式,这会阻碍模型更好地学习单词的不同组合特性。该文提出一种加标签融合多种亚词序列的方法,不同BPE融合次数切分相同的训练数据,得到不同的亚词序列,进行加标签融合,其中相同单词的不同亚词参与训练,使模型能够更好地学习词的不同的组合形式。该文中的方法在形态复杂的语言和形态简单的语言对上均有了0.5个BLEU值以上的提高。实验表明,不同的亚词序列质量越好,相似度越低,融合后训练的翻译模型质量越好。
- 刘婉月艾山·吾买尔李哲韩越张大任宜年
- 一种用于低资源黏着性语言文本分类的语言模型微调方法
- 本发明公开了一种用于低资源黏着性语言文本分类的语言模型微调方法,涉及语言处理技术领域,通过形态学分析和词干提取构建低噪声微调数据集,在该数据集上对跨语言预训练模型进行微调,为下游文本分类任务提供有意义且易于使用的特征提取...
- 柯尊旺李哲蔡茂昌曹如鹏
- 基于短语的维吾尔文文本分类被引量:5
- 2012年
- 文本特征表示是在文本自动分类中最重要的一个环节。在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机(SVM)算法对维吾尔文文本进行了分类实验。实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔文文本分类的准确率和召回率。
- 阿力木江·艾沙吐尔根·依布拉音库尔班·吾布力李哲
- 关键词:文本分类短语抽取支持向量机维吾尔语互信息
- 一种多模态虚假信息检测方法
- 本发明公开了一种多模态虚假信息检测方法,涉及多模态虚假信息检测技术领域,包括以下步骤:对推文中包含的图片和文本进行数据增强处理;将原图片和处理后的图片输入至图片编码器ResNet50,获得图片隐藏向量,并将原文本和处理后...
- 李秀红周晨宇李哲
- 一种用于低资源黏着性语言文本分类的语言模型微调方法
- 本发明公开了一种用于低资源黏着性语言文本分类的语言模型微调方法,涉及语言处理技术领域,通过形态学分析和词干提取构建低噪声微调数据集,在该数据集上对跨语言预训练模型进行微调,为下游文本分类任务提供有意义且易于使用的特征提取...
- 柯尊旺李哲蔡茂昌曹如鹏
- 文献传递