上海市科委科技攻关项目(07dz15007)
- 作品数:2 被引量:42H指数:2
- 相关作者:张玥杰徐智婷薛向阳张涛杨辉更多>>
- 相关机构:复旦大学上海市智能信息处理重点实验室上海财经大学更多>>
- 发文基金:上海市科委科技攻关项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词典的英汉双向跨语言信息检索方法被引量:5
- 2009年
- 基于文本检索会议关于英汉跨语言信息检索的任务评价,分别以英汉双向查询翻译和英汉查询为主导策略与翻译对象,采用英汉电子词典作为获取翻译知识的知识源,结合构建的英汉单语信息检索系统,实现完整的英汉双向跨语言信息检索过程。实验结果验证了该系统的有效性。
- 杨辉张玥杰张涛
- 关键词:跨语言信息检索查询翻译电子词典汉语分词
- 融合多特征的最大熵汉语命名实体识别模型被引量:37
- 2008年
- 最大熵模型能有效整合多种约束信息,对于汉语命名实体识别具有很好的适用性.因此,将其作为基本框架,提出一种融合多特征的最大熵汉语命名实体识别模型.该模型集成局部与全局多种特征,同时为降低搜索空间并提高处理效率,而引入了启发式知识.基于SIGHAN 2008命名实体评测任务测试数据的实验结果表明,所建立的混合模式是一种组合统计模型与启发式知识的有效汉语命名实体识别模式.基于不同测试数据的实验说明,该方法针对不同测试数据源具有一致性.
- 张玥杰徐智婷薛向阳
- 关键词:命名实体识别最大熵模型启发式知识
- 基于关系数据库的RDF数据存储
- 在语义网中,信息以及信息之间的关系使用元数据和本体库来表示,RDF和RDF Schema是W3C规定的用于表示元数据和本体的标准。由于RDF数据具有图的结构特点,存储和查询比较复杂,没有一个统一的标准,因此如何有效地存储...
- 陶导钱卫宁魏芳周傲英