您的位置: 专家智库 > >

国家自然科学基金(61063022)

作品数:7 被引量:10H指数:2
相关作者:维尼拉·木沙江薛中奇赵丽红艾克白尔·帕塔尔吐尔地·托合提更多>>
相关机构:新疆大学更多>>
发文基金:国家自然科学基金新疆维吾尔自治区高校科研计划新疆维吾尔自治区高技术研究发展计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 7篇自动化与计算...

主题

  • 4篇维吾尔
  • 4篇维吾尔文
  • 3篇索引
  • 2篇倒排索引
  • 2篇数据压缩
  • 2篇搜索
  • 1篇引擎
  • 1篇数组
  • 1篇搜索引擎
  • 1篇索引技术
  • 1篇索引器
  • 1篇特征提取
  • 1篇切分
  • 1篇全文搜索
  • 1篇网页
  • 1篇网页分类
  • 1篇维吾尔语
  • 1篇文本
  • 1篇文本分类
  • 1篇邻接

机构

  • 7篇新疆大学

作者

  • 2篇维尼拉·木沙...
  • 2篇赵丽红
  • 2篇薛中奇
  • 1篇海丽且木·艾...
  • 1篇艾斯卡尔·艾...
  • 1篇吐尔地·托合...
  • 1篇艾克白尔·帕...

传媒

  • 3篇新疆大学学报...
  • 2篇电脑知识与技...
  • 1篇模式识别与人...
  • 1篇现代计算机(...

年份

  • 1篇2013
  • 1篇2012
  • 5篇2011
7 条 记 录,以下是 1-7
排序方式:
维、哈、柯多语种搜索引擎中改进索引创建的新方法的构思
2011年
通过对目前处于研究发展阶段的后缀数组技术与倒排索引技术的简单介绍,并对两者的优缺点进行了对比,对维、哈、柯文搜索引擎的索引创建进行改进的新方法提出了构思,以实现查询效率和查准率的提高。
赵丽红维尼拉·木沙江
关键词:索引技术倒排索引后缀数组
维吾尔文搜索引擎中的压缩技术
2011年
在对常用压缩技术进行介绍的基础上,结合维吾尔语代码特点来选择合适的压缩技术对文本进行压缩,以实现压缩率的提高,从而减少搜索引擎对数据空间要求。通过初步实验验证所选方法具有一定的正确性,取得了一定的效果。
薛中奇维尼拉.木沙江赵丽红
关键词:数据压缩维吾尔语搜索引擎
维、哈、柯多语种搜索引擎中索引器的研究被引量:2
2011年
本文主要研究维、哈、柯多语种全文搜索引擎索引器模块中的关键问题,并提出了一系列有效的解决方法.包括适合于维、哈、柯多语种全文搜索引擎的倒排索引结构,检索算法,倒排表的更新策略以及低频词的置换处理等.实验结果表明,该方法能满足维、哈、柯语言文字的处理需要,同时明显地提高了维、哈、柯文搜索引擎的索引效率以及搜索结果的质量.
吐尔洪.吾司曼维尼拉.木沙江
关键词:全文搜索倒排索引
维、哈、柯多文种搜索引擎中web文本分类的研究被引量:3
2011年
研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN的Web文本分类方法,并结合具体实验在对数据进行预处理的基础上实现了改进的KNN分类算法.实验表明,改进的KNN方法在维吾尔文Web文本分类中能够获得较好的分类效果.
海丽且木.艾沙维尼拉.木沙江
关键词:WEB文本分类KNN算法特征提取维吾尔文
网页分类及其维文信息检索中的应用研究被引量:2
2011年
研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提高信息检索系统的查询准确率,使得返回结果更符合用户检索需求。
海丽且木·艾沙维尼拉·木沙江
关键词:网页分类
维吾尔文无监督自动切分及无监督特征选择被引量:3
2013年
维吾尔文常用切分方法会产生大量的语义抽象甚至多义的词特征,因此学习算法难以发现高维数据中隐藏的结构.提出一种无监督切分方法 dme-TS和一种无监督特征选择方法 UMRMR-UFS.dme-TS从大规模生语料中自动获取单词Bi-gram及上下文语境信息,并将相邻单词间的t-测试差、互信息及双词上下文邻接对熵的线性融合作为一个组合统计量(dme)来评价单词间的结合能力,从而将文本切分成语义具体的独立语言单位的特征集合.UMRMR-UFS用一种综合考虑最大相关度和最小冗余的无监督特征选择标准(UMRMR)来评价每一个特征的重要性,并将最重要的特征依次移入到特征子集中.实验结果表明dme-TS能有效控制原始特征集的规模,提高特征项本身的质量,用UMRMR-UFS的输出来表征文本时,学习算法也表现出其最高的性能.
吐尔地·托合提艾克白尔·帕塔尔艾斯卡尔·艾木都拉
关键词:互信息
维吾尔文文本的压缩技术研究
2012年
对维吾尔语特点分析的基础上,结合数据压缩技术选择LZW算法对维吾尔文文本进行压缩,提高压缩率、减少数据存储空间.实验结果表明,改进后的算法对维吾尔文文本具有较高的压缩率.
薛中奇维尼拉.木沙江
关键词:维吾尔文数据压缩LZW
共1页<1>
聚类工具0