江苏省教育厅哲学社会科学基金(2010JDXM037)
- 作品数:3 被引量:42H指数:3
- 相关作者:钱智勇苏新宁童国平周建忠涂中群更多>>
- 相关机构:南通大学南京大学更多>>
- 发文基金:江苏省教育厅哲学社会科学基金国家社会科学基金江苏省社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于HMM的楚辞自动分词标注研究被引量:30
- 2014年
- 研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。
- 钱智勇周建忠童国平苏新宁
- 关键词:隐马尔科夫模型楚辞自动分词词性标注
- 楚辞文献数字化与关联检索可视化实现被引量:6
- 2012年
- 论文在概述古籍数字化概念内涵的基础上,以楚辞相关古籍数字化为实例,结合楚辞文献的特点分析了楚辞文献实体款目之间相关性的主要内容。利用本体软件构建楚辞文献实体层次结构和对象属性,实现了楚辞文献可视化关联检索。
- 钱智勇
- 关键词:楚辞数字化本体
- 基于语义的个性化关联检索模型构建研究——以楚辞研究数据库的实现为例被引量:6
- 2013年
- 依据语义检索的特征和文本概念的挖掘,通过楚辞研究数据库的语义实践,提出一种以本体知识库建设为核心,由本体开发、资源管理、检索服务三层架构组成,融语义词典、知识地图、跨库查询和专题搜索为一体的个性化关联语义检索模型,力图使当前的语义检索研究跳出实验的框架,促进相关领域文献知识的组织开发与检索利用。
- 涂中群端木艺
- 关键词:语义检索模型构建文本挖掘楚辞