您的位置: 专家智库 > >

张山山

作品数:2 被引量:2H指数:1
供职机构:华中科技大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 1篇冗余
  • 1篇冗余信息
  • 1篇数据压缩
  • 1篇中文
  • 1篇中文分词
  • 1篇文档
  • 1篇可扩展
  • 1篇可扩展标记语...
  • 1篇扩展标记语言
  • 1篇分词
  • 1篇标记语言
  • 1篇词典
  • 1篇COX

机构

  • 2篇华中科技大学
  • 1篇中国工程物理...

作者

  • 2篇张山山
  • 1篇路松峰
  • 1篇吴志杰
  • 1篇赵友桥

传媒

  • 1篇计算机工程与...

年份

  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
中文XML压缩技术研究
随着可扩展标记语言(Extensible Markup Language,简称XML)的广泛应用,互联网以及本地计算机上存在着大量的中文XML文档需要存储和交换。XML是一种元语言,可以用来描述其它数据,并且XML具有简...
张山山
关键词:可扩展标记语言冗余信息
COX:高压缩率的中文XML文档压缩技术被引量:2
2012年
针对当前常用的XML压缩算法没有考虑中文特点的情况,结合中文与XML的特点,提出一种高压缩率的适合中文XML文档的压缩算法COX。利用中文分词技术对XML文档进行分词处理,通过统计词频后获得排序的词典,利用Huffman编码思想对高频及长词汇进行压缩编码;解析XML文档后,把文档元素进行分类,同一类型的元素放入同一容器之中;算法还特别针对数字类型的数据进行了特殊处理。实验结果显示,相对于通用的压缩软件,COX具有更好的压缩效果,但压缩和解压缩时间要慢一些。
赵友桥张山山路松峰吴志杰
关键词:数据压缩中文分词词典
共1页<1>
聚类工具0