国家高技术研究发展计划(2012AA12A403-3) 作品数:4 被引量:40 H指数:4 相关作者: 张春菊 张雪英 王曙 李明 廖建平 更多>> 相关机构: 合肥工业大学 南京师范大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 天文地球 自动化与计算机技术 更多>>
中文文本中时间信息解析方法 被引量:17 2014年 探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。 张春菊 张雪英 李明 王曙关键词:中文文本 基于XML Schema的多源地名词典集成方法 被引量:5 2012年 目前,我国已经构建大量不同级别、面向不同应用的地名词典,网络大众化地名服务成为地名词典的必然发展趋势。该文提出一种基于XML Schema的多源异构地名词典集成方法,以XML Schema对地名词典进行数据描述,采用XSLT数据转换方法,运用MapForce软件,快速进行地名词典的数据结构映射,能够有效解决地名词典的跨平台及数据类型不统一问题。 张雪英 朱少楠 张春菊 徐希涛 杜超利关键词:XMLSCHEMA 数据集成 XSLT 面向中文文本的事件时空与属性信息解析方法研究 被引量:9 2015年 随着网络与信息技术的快速发展,人们作为“传感器”行走在真实社会中制造实时的、实地环境的、大范围的地理信息.互联网逐步发展为地理信息最大的收藏地.地理信息已步入大数据时代,其中80%的数据为非结构化数据(包括自然语言、图像、视频等).文本是人们空间认知结果的自然语言表现形式,也是最重要的地理信息来源和最有潜力的人机交互手段. 张春菊关键词:中文文本 属性信息 地理信息 非结构化数据 自然语言 中文文本的事件时空信息标注 被引量:12 2016年 基于文本数据源的地理空间信息解析研究侧重于地名实体、空间关系等空间语义角色的标注和抽取,忽略了丰富的时间信息、主题事件信息及其时空一体化信息。该文通过分析中文文本中事件信息描述的语言特点和事件的时空语义特征,基于地名实体和空间关系标注研究成果,制定了中文文本的事件时空信息标注体系和标注模式,并以GATE(General Architecture for Text Engineering)为标注平台,以网页文本为数据源,构建了事件时空信息标注语料库。研究成果为中文文本中地理信息的语义解析提供标准化的训练和测试数据。 张春菊 张雪英 王曙 廖建平 陈晓丹关键词:中文文本 时空信息 标注语料库