您的位置: 专家智库 > >

国家自然科学基金(60663008)

作品数:3 被引量:9H指数:2
相关作者:张志平赵小兵刘荣王丽娟唐长宁更多>>
相关机构:北京语言大学中央民族大学太原理工大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文

领域

  • 3篇自动化与计算...
  • 2篇语言文字

主题

  • 3篇汉语
  • 2篇现代汉语
  • 1篇动态流通语料...
  • 1篇新闻
  • 1篇新闻文本
  • 1篇用词
  • 1篇语料
  • 1篇语料库
  • 1篇语言
  • 1篇语言生活
  • 1篇中国语言
  • 1篇中国语言生活
  • 1篇中国语言生活...
  • 1篇数字化
  • 1篇通用词
  • 1篇通用词汇
  • 1篇通语
  • 1篇字词
  • 1篇文本分类
  • 1篇稳态

机构

  • 4篇北京语言大学
  • 2篇中央民族大学
  • 1篇内蒙古师范大...
  • 1篇太原理工大学

作者

  • 3篇张志平
  • 2篇赵小兵
  • 1篇唐长宁
  • 1篇王丽娟
  • 1篇刘荣

传媒

  • 2篇太原理工大学...
  • 1篇内蒙古师范大...

年份

  • 1篇2010
  • 1篇2009
  • 3篇2008
3 条 记 录,以下是 1-5
排序方式:
面向现代汉语动态流通语料库的html To xml转换工具的设计和实现
2008年
分析了目前HTML与XML格式的特点及现有的html to xml转换软件的不足,给出面向现代汉语动态流通语料库的html To xml软件的设计和实现过程.编码过程利用面向对象思想,使用Java编程语言,可以实现跨平台运行.用测试用例对软件做了相应测试,达到了预期效果.
唐长宁张志平赵小兵
关键词:HTMLXMLHTML
有利于数字化汉语教学的现代汉语稳态词语研究
本文介绍了与数字化汉语教学密切相关的现代汉语稳态词语的研究的有关进展。包括国家语言资源监测与研究中心、中国语言生活绿皮书、《中国语言生活状况报告》、语言监测的实态问题、语言应用的稳态与动态问题等,着重介绍了现代汉语稳态词...
张普
关键词:中国语言生活状况报告稳态
基于“中文新闻信息分类与代码”文本分类被引量:5
2010年
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。
张志平
关键词:文本分类新闻文本
利用高频词和互信息面向特定领域提取多字词表达被引量:4
2009年
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字词表达进行噪声处理。实验结果表明:笔者提出的方法在处理对象规模、效率等方面均有所提高。
刘荣王丽娟张志平赵小兵
关键词:高频词互信息
语言工程用现代汉语通用词汇自动提取研究初步
本文提出了'语言工程用现代汉语通用词CCWE'的概念以及CCWE词汇的通用度的计算共识及提取方法,给出了CCWE的提取实验验证及2002年~2006年中国大陆地区发行的六份主流报纸的CCWE词汇的提取结果。本研究为词汇的...
赵小兵张普
关键词:分布均匀度
共1页<1>
聚类工具0