国家自然科学基金(71273126)
- 作品数:41 被引量:535H指数:11
- 相关作者:苏新宁徐绪堪蒋勋王东波郑昌兴更多>>
- 相关机构:南京大学南京中医药大学南京农业大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:文化科学自动化与计算机技术语言文字文学更多>>
- 齐普夫定律在中文短语知识中的呈现被引量:5
- 2014年
- 本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。
- 谢靖陈静王东波
- 关键词:齐普夫定律
- 知识服务环境下分类表的知识组织探究被引量:8
- 2014年
- 在知识服务这一大的研究环境下,基于分类表这一知识分类的工具探究知识组织的具体情况。从揭示知识内在联系的角度,细致地分析了分类表的知识组织结构。针对关系数据库的数据机器存储方式在分类表知识更新、删除、添加上存在的不足之处,给出分类表的图形数据库存储方式以及具体的检索案例。
- 沈思苏新宁
- 关键词:知识服务分类表图形数据库知识组织
- 我国外国文学研究热点知识图谱分析——基于CSSCI(2000-2011)被引量:3
- 2014年
- 基于CSSCI收录外国文学核心期刊2000-2011年间发表文献,本文利用知识图谱工具对我国外国文学研究热点进行分年度可视化分析。以3年为一个时间片,文章通过可视化的研究热点图谱,展现2000-2011年间我国外国文学研究热点及其变化。
- 钱爱兵杨欣
- 关键词:外国文学知识图谱CSSCI
- 面向汉语句法功能分布知识库的词汇类别知识挖掘研究被引量:5
- 2013年
- 基于清华大学汉语树库,通过多叉树存储结构,构建汉语词汇的句法功能分布知识库。在构建的句法功能分布知识库基础上,利用Sparse Feature Clustering(SFC)中的K-medoids聚类算法,对汉语词汇的类别知识进行挖掘探究。
- 王东波朱丹浩
- 关键词:树库知识库SFC
- 基于知识单元的知识组织过程研究被引量:7
- 2014年
- 大数据时代,用户需求对知识组织水平要求日益提高,针对问题和问题解答所需数据具有多、冗、杂、乱和新等特点,传统先组式组织方式无法满足有效解答用户的问题,因此在文章中,问题驱动从宏观架构知识的组织,借助知识颗粒度和知识单元来设计知识组织过程,通过问题导航知识单元的获取、序化、关联、再生和应用,以知识仓库来存储知识,针对不同类型的问题,以知识单元作为节点,以知识关联为纽带创建面向问题的知识单元关联网。
- 徐绪堪房道伟蒋亚东
- 关键词:知识单元知识组织粒度原理知识关联
- 知识组织中知识粒度化表示和规范化研究被引量:35
- 2014年
- 知识组织过程的核心就是知识存储和利用,目的是通过提供知识服务解决用户的问题。在解决问题过程中需要不同层次和不同颗粒度的知识,而根据用户要求进行不同颗粒度大小知识的转化。为了描述转化过程中的不确定性,首先利用粒度原理对知识进行粒度化表示,通过知识粒度概念和构成来表示不同的知识,并用知识聚合度来量化知识之间关联程度,然后充分结合用户需求和已有的规范,通过文献著录规范、文献标引规范、知识表示规范、知识融合规范等四个层次制定知识划分和粒度化规范,从而确保知识共享和重用,为解决用户的问题奠定基础。
- 徐绪堪房道伟蒋勋苏新宁
- 关键词:知识管理知识组织知识服务知识粒度粒度
- 面向知识服务的知识组织工具:现状与未来被引量:11
- 2013年
- 从知识服务角度出发,对知识组织工具进行探讨,将其划分为基础知识与知识架构类工具、知识关系建立类工具、知识处理及展现类工具。从这三个分类的角度,对现有的知识组织工具分别进行探讨。基础知识与知识架构类工具主要通过系统化知识组织提供知识点推送服务,充当语义级的知识库角色;知识关系建立类工具则通过对知识点的关联建立提供深层次的知识关联服务,在此基础上通过与基础知识及知识架构类工具相结合,提供相应的知识推理服务;知识处理及展现类工具是知识抽取、关系建立、呈现等工作中所涉及的实用工具,这些工具以用户需求为中心完成对知识的重组。最后,对知识组织工具的未来进行展望,提出多维融合、网络化、分布式、个性化、动态化是其发展方向。
- 谢靖钱爱兵韩普苏新宁
- 关键词:知识组织知识服务知识组织工具
- 基于MapReduce的书目数据关联匹配研究被引量:10
- 2013年
- 提出一个基于MapReduce的书目数据关联匹配架构,通过参引MODS本体将MARC格式的书目数据转换成关联数据格式。再通过对书目数据和书目数据间的关联匹配,以及书目数据和开放关联社区其他的关联数据间的匹配初步实现书目数据和其他关联数据集间的语义关联,使关联的书目数据成为关联开放数据社区中的一部分,为图书馆的知识发现和语义检索服务提供有效的语义数据支持。
- 虞为陈俊鹏
- 关键词:MAPREDUCE书目数据关联数据
- 我国新闻学与传播学研究热点知识图谱分析——基于CSSCI(2000-2011年)被引量:3
- 2014年
- 知识图谱是近年来科学计量学研究兴起的新领域,通过知识图谱可以可视化的展现学科内的知识结构。本文以知识图谱作为研究方法,分年度构建了我国新闻学与传播学研究热点知识图谱,在可视化分析与定量分析基础上,展现了2000-2011年间我国新闻学与传播学的发展与演化。
- 叶新海陈华英
- 关键词:知识图谱CSSCI
- 突发事件检测的MapReduce并行化实现被引量:3
- 2015年
- 【目的】在大数据环境下,从文本流中准确且快速地检测出特定领域的突发事件。【方法】利用Kleinberg突发检测方法和LDA主题模型方法,将其扩展到Map Reduce并行框架中,实现并行语料预处理、并行突发词检测、并行突发文档过滤和并行主题提取。【结果】对新闻文本流进行模拟仿真实验,结果表明,该并行方法在特定领域突发事件检测中准确率P、召回率R和调和平均值F分别最高可达87.50%、77.78%和82.35%。【局限】基于Map Reduce的并行方法难以实现大规模动态文本流在线(Online)实时(Real-time)突发事件检测。【结论】与传统串行突发事件检测方法相比,所构建的分布式并行化方法在保证检测结果正确性的同时,具有良好的可扩展性,性能得到较大提升。
- 卓可秋虞为苏新宁
- 关键词:MAPREDUCE分布式处理LDA主题模型