-
金澎
-

-

- 所属机构:乐山师范学院
- 所在地区:四川省 乐山市
- 研究方向:自动化与计算机技术
- 发文基金:国家自然科学基金
相关作者
- 陈兴元

- 作品数:17被引量:2H指数:1
- 供职机构:乐山师范学院
- 研究主题:存储介质 生成器 鉴别器 机器人位姿 机器人定位
- 孙锐

- 作品数:33被引量:54H指数:5
- 供职机构:乐山师范学院
- 研究主题:自然语言处理 语句 新闻报道 突发事件 主题
- 吴云芳

- 作品数:50被引量:339H指数:13
- 供职机构:北京大学
- 研究主题:词义消歧 中文信息处理 汉语 计算机应用 自然语言处理
- 张九华

- 作品数:68被引量:58H指数:5
- 供职机构:乐山师范学院
- 研究主题:浮渣 外筒 电极 物联网 计算机
- 敬思远

- 作品数:37被引量:26H指数:3
- 供职机构:乐山师范学院
- 研究主题:时间序列 时间序列数据 知识图谱 虚拟机迁移 虚拟数据中心
- 基于词频学习和动态词频更新的藏文自动分词系统设计被引量:4
- 2014年
- 藏文自动分词问题是藏文自然语言处理的基本问题之一。针对藏文自动分词中的重点难点,例如:格助词的识别、歧义切分、未登录词识别技术设计一个新的藏文自动分词系统。该系统采用动态词频更新和基于上下文词频的歧义处理和未登录词识别技术。在歧义字段分词准确性、未登录词识别率和分词速度上,该系统具有较优的性能。
- 项炜金澎
- 关键词:格助词歧义处理未登录词识别
- 谓词自动识别中的特征选择度量研究
- 的自动识别是浅层句法分析的重要内容.本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法.
- 张宜浩金澎
- 一种水军用户检测方法、装置、设备及介质
- 本发明涉及数据处理技术领域,尤其涉及一种水军用户检测方法、装置、设备及介质,该方法应用于水军用户检测系统中,该系统包括:样本数据集获取模块,生成器,拼接模块以及鉴别器,方法包括,从网络上获取第一网络文本信息;基于生成器、...
- 陈兴元金澎张九华
- 词义消歧若干关键技术研究
- 词义消歧是计算语言学领域的基础研究课题之一,长期以来在机器翻译中扮演重要角色。在Internet迅速扩张的今天,词义消歧也是提高信息检索性能的重要途径。本文针对有指导词义消歧中的数据稀疏问题和无指导词义消歧中的义项分布估...
- 金澎
- 关键词:信息检索词义消歧
- 词间相关性在Web检索中的新应用被引量:6
- 2002年
- 首先分析了以往信息检索中利用词间相关性的局限性,针对Internet检索对象是Web页面,具有篇幅较小的特点犤2犦,提出“主题关键词集合”的概念,利用词间相关性,通过计算用户查询词集合与网页主题关键词集合之间的距离,对检索结果重新排序。
- 王树梅金澎
- 关键词:WEB信息检索搜索引擎INTERNET
- 基于HTML标签分析的网页加权索引策略
- 本文受传统信息检索中对文本结构信息挖掘的启发,针对Web页面特点,提出基于HTML标签处理的加权策略,用于Internet搜索引擎.引言简单介绍纯文本信息检索中的词加权方法;第二部分在纯文本文档的加权公式tf<'*>id...
- 金澎刘毅刘伟
- 关键词:信息检索搜索引擎HTML标签信息挖掘
- 文献传递
- 文本分类中的主动多域学习被引量:3
- 2014年
- 现有主动学习主要着眼于对单个域训练方法的研究,不同域有不同的特征,同时也存在一些隐含的共性.如何从多个域中选择合适数据样本成为多域学习中减少人工标注工作量的关键.本文提出了一个新颖的主动多域学习框架,该框架充分考虑了重复信息,并可从多个域中选择合适的数据样本.该框架首先找到一个包含不同域间隐含共性的共享子空间,然后将所有数据样本分解为公共域部分和个性域部分,其中公共域部分可视为域间的重复信息,该部分在查询时需要被考虑到.最后,将主动多域学习方法与最新的主动学习方法的性能进行了比对,实验结果表明,本文提出的主动多域学习方法在减少人工标注工作量方面有显著作用.
- 赖娟金澎洪艳伟
- 基于大规模语料库的汉语词相似计算被引量:2
- 2010年
- 针对词语相似度这一问题,在大规模语料库上,通过分布相似对汉语词相似进行了研究.实现了一个词相似计算平台,可灵活组合各种计算词相似算法,新增加语料库可以被增量式用于计算;对比研究了基于距离的度量和基于概率的度量2类算法的性能,通过和人工创建的黄金标准进行比较,基于概率的度量算法要优于基于距离的度量算法.
- 买志玉金澎曾赛
- 关键词:自然语言处理
- 基于依存语法构建多视图汉语树库被引量:10
- 2015年
- 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。
- 邱立坤金澎王厚峰
- 关键词:依存语法
- 无条件文本生成方法、文本生成装置及存储介质
- 本发明公开了一种无条件文本生成方法,包括以下步骤:控制生成器生成文本数据;通过第一鉴别器计算所述文本数据中每一子文本的第一文本得分;根据每一所述子文本的所述第一文本得分确定目标子文本,并将所述目标子文本作为文本生成结果。...
- 金澎陈兴元
- 文献传递