您的位置: 专家智库 > >

郑亚斌

作品数:6 被引量:37H指数:2
供职机构:清华大学计算机科学与技术系更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术语言文字自然科学总论更多>>

文献类型

  • 4篇会议论文
  • 2篇期刊文章

领域

  • 5篇自动化与计算...
  • 2篇语言文字
  • 1篇自然科学总论

主题

  • 3篇齐夫定律
  • 2篇统计特征
  • 2篇网络
  • 2篇马尔科夫
  • 2篇马尔科夫模型
  • 2篇节奏
  • 2篇歌词
  • 2篇复杂网
  • 2篇复杂网络
  • 2篇K-近邻
  • 1篇动态规划
  • 1篇对联
  • 1篇信息处理
  • 1篇语言学
  • 1篇数理语言学
  • 1篇同现
  • 1篇统计性质
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理

机构

  • 6篇清华大学

作者

  • 6篇郑亚斌
  • 6篇刘知远
  • 4篇孙茂松
  • 2篇曹嘉伟
  • 1篇司宪策

传媒

  • 1篇中文信息学报
  • 1篇复杂系统与复...
  • 1篇第四届全国学...

年份

  • 3篇2008
  • 3篇2007
6 条 记 录,以下是 1-6
排序方式:
基于最大匹配和马尔科夫模型的对联系统
对联,雅称"楹联",俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式。可以说,对联艺术是中华民族的文化瑰宝。如何利用计算机自动生成对联是一个值得研究的方向,本文开发了一种基于前向最大匹配和一阶...
郑亚斌曹嘉伟刘知远
关键词:动态规划对联
文献传递
基于最大匹配和马尔科夫模型的对联系统
对联,雅称“楹联”,俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式,可以说对联艺术是中华民族的文化瑰宝,如何利用计算机自动生成对联是一个值得研究的方向。 本文开发了一种基于前向最大...
郑亚斌曹嘉伟刘知远
关键词:汉字处理数理语言学马尔科夫模型
文献传递
中文博客标签的若干统计性质
随着 Wleb2.0理念日益深入人心,博客作为一种网络日志的形式,成为网络上的主要应用之一。而主要出现在博客、网络相册等系统上的,依靠大量用户使用自由选择的词汇作为标签(Tag)来对事物进行标记的人工分类的“大众分类法”...
刘知远司宪策郑亚斌孙茂松
关键词:标签齐夫定律复杂网络
汉语依存句法网络的复杂网络性质被引量:28
2008年
基于大规模语料库,建立了汉语依存句法网络,并从复杂网络的角度对该网络进行了系统的实验考察。实验结果表明汉语依存句法网络具有复杂网络的两个基本性质:小世界效应和无标度特性,并在其他方面也体现了复杂网络的重要性质。汉语的这些句法上的统计特性,与捷克语、德语和罗马尼亚语等极为相似,说明虽然不同语言有着极为不同的句法规则,但它们具有类似的统计特性,这种共性对人类语言本质的研究具有一定的启发意义。
刘知远郑亚斌孙茂松
关键词:汉语复杂网络小世界同现
中文歌词的统计特征及其检索应用被引量:9
2007年
我们在歌词上做了一些传统的自然语言处理相关的实验。歌词是歌曲语义上的重要表达,因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实验表明,其分布基本符合齐夫定律。利用向量空间模型的表示,我们可以找到比较相似的歌词集合。另外,我们探讨了如何利用歌词中的时间标注信息进行进一步的分析:例如发现歌曲中重复片段,节奏划分,检索等。初步的实验表明,我们的方法具有一定的效果。
郑亚斌刘知远孙茂松
关键词:中文信息处理歌词齐夫定律K-近邻节奏
中文歌词的统计特征及其检索应用
我们在歌词上做了一些传统的自然语言处理相关的实验。大部分的歌曲都具有与其相匹配的歌词,歌词也是歌曲语义上的重要表达。因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实...
郑亚斌刘知远孙茂松
关键词:歌词齐夫定律K-近邻节奏
文献传递
共1页<1>
聚类工具0