章露露
- 作品数:3 被引量:5H指数:1
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:云南省高层次科技人才培引工程国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词向量的无监督词义消歧方法被引量:3
- 2018年
- 词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。
- 吕晓伟章露露
- 关键词:词义消歧自然语言处理机器翻译
- 基于Word2vec的语义查询扩展方法被引量:1
- 2018年
- 查询扩展是信息检索领域重要研究内容。为了解决信息检索过程中用户提交查询时描述不准确以及查询词不匹配的问题,提出一种基于Word2vec的语义查询扩展方法。使用分布式神经语言概率模型Word2vec训练低维词向量,选取扩展词候选集,利用面向扩展词的查询向量生成方法过滤候选集,使选取的扩展词能更有效地体现整个查询的语义及语法相关性。实验结果表明基于Word2vec的语义查询扩展方法使查全率及查准率均有提高,因此该方法能很好地应用于查询扩展领域。
- 章露露吕晓伟
- 关键词:查询扩展语义相关性
- 基于OpenMP的并行集合包含查询算法被引量:1
- 2016年
- 集合包含查询分为子集、等值和超集3种查询,在多个领域有重要的研究意义和应用价值.随着集合数据集规模的不断增大,迫切需要提高集合包含查询的效率.集合包含查询并行化是解决这一问题的一条途径,基于OpenMP提出并行子集、等值和超集查询算法,这些算法采用反向索引结构,通过for循环并行化实现查询间的并行执行.为提高算法效率,设计2个高效的并行共享数据结构:1PVEC结构:用于存储并行查询结果.2CountArr数组:针对超集查询,用于对反向列表中的元素计数,并行线程可异步地对这两个结构进行访问.在MSWEB和DBLP 2个数据集上进行扩展实验,结果表明,实现的3种并行集合包含查询具有较高的效率,对3种查询在MSWEB数据集上均可达到4X以上的加速比.
- 李孟娟贾连印陈文焰吕晓伟章露露
- 关键词:OPENMP