您的位置: 专家智库 > >

杨东华

作品数:29 被引量:155H指数:6
供职机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划黑龙江省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学电气工程更多>>

文献类型

  • 15篇期刊文章
  • 10篇专利
  • 2篇学位论文
  • 2篇会议论文

领域

  • 22篇自动化与计算...
  • 1篇电气工程
  • 1篇文化科学

主题

  • 6篇数据库
  • 6篇查询
  • 6篇查询处理
  • 5篇矩阵
  • 4篇知识图
  • 4篇知识图谱
  • 4篇数据清洗
  • 4篇数据网
  • 4篇数据网格
  • 4篇索引
  • 4篇网格
  • 4篇相似度
  • 3篇迭代
  • 3篇数据处理
  • 3篇外存
  • 3篇网格环境
  • 3篇海量
  • 3篇海量数据
  • 3篇存储介质
  • 2篇电网

机构

  • 29篇哈尔滨工业大...
  • 1篇黑龙江大学
  • 1篇中兴通讯股份...
  • 1篇中国电力科学...

作者

  • 29篇杨东华
  • 17篇王宏志
  • 10篇李建中
  • 8篇高宏
  • 6篇王金宝
  • 3篇韩希先
  • 2篇周游
  • 2篇左德承
  • 2篇刘怀远
  • 1篇张文平
  • 1篇苑野
  • 1篇何涛
  • 1篇李宁宁

传媒

  • 5篇计算机学报
  • 3篇计算机研究与...
  • 3篇软件学报
  • 1篇中国电机工程...
  • 1篇哈尔滨商业大...
  • 1篇计算机科学与...
  • 1篇大数据
  • 1篇第29届中国...

年份

  • 1篇2024
  • 7篇2023
  • 1篇2022
  • 2篇2021
  • 2篇2020
  • 3篇2018
  • 1篇2016
  • 1篇2015
  • 2篇2012
  • 2篇2011
  • 3篇2010
  • 1篇2008
  • 2篇2004
  • 1篇2003
29 条 记 录,以下是 1-10
排序方式:
知识驱动的大电网仿真分析知识建模方法及其在潮流智能调整问题中的应用
2023年
大电网数字仿真分析需要耗费大量的人力和时间成本来进行综合仿真分析,其分析和调整过程严重依赖人工经验知识,且由于经验知识表述的多样性和应用场景的特殊性,缺乏一套统一的知识表示方法。为此,提出一种电网人工智能仿真分析的知识建模方法。根据电网数字仿真分析调整知识经验的特点,将定性与定量、关联与事理知识相结合,分别针对调整流程、调整操作和程序调用设计基于主谓宾语(subject-predicate-object,SPO)的知识表示方法;搭建模块化的知识驱动模型将电网仿真分析过程智能化;设计一套知识抽取与清洗方法来获取所需的三元组形式知识,利用获得的知识三元组构建知识图谱,开发可视化的知识库管理系统。在改进的CEPRI36节点系统和东北电网上进行潮流计算收敛调整仿真实验,验证方法的可行性和有效性。
刘怀远文晶陈兴雷黄河凯王甜婧王宏志黄彦浩汤涌杨东华
关键词:知识图谱知识建模知识库知识驱动
海量数据上的近似连接聚集操作被引量:3
2010年
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此提出了一种新的算法——(p,ε)-近似连接聚集查询(pε-AJA)来有效地返回满足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本(JRS)和连接位置索引对表(JPIPT).利用JRS,pε-AJA向用户返回近似结果的快速响应.如果利用JRS得到的近似结果没有满足给定的置信区间,pε-AJA利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPIPT和JRS有效的构建和维护算法.实验结果表明:pε-AJA可以获得相对于准确查询1~5个数量级的加速,并且可以有效地完成JPIPT和JRS的构建和维护操作.
韩希先杨东华李建中
关键词:海量数据
多嵌入式数据库缓冲区大小协调优化方法及系统
多嵌入式数据库缓冲区大小协调优化方法及系统,涉及数据库技术领域,针对现有技术中对嵌入式数据库优化时,往往是逐个进行优化,这一过程在同一个系统中重复执行多次,不但浪费时间且使每一个数据库的缓存大幅增长,导致其他程序运行时,...
张昊然王宏志丁小欧杨东华左德承
变压器油色谱数据的迭代式清洗方法
一种变压器油色谱数据的迭代式清洗方法,属于数据清洗技术领域。本发明针对变压器油色谱数据中的劣质数据不能被有效识别并清洗的问题。包括:将原始数据集中的数据分为违反规则数据集和符合规则数据集;采用符合规则数据集对分类器进行预...
刘一达丁小欧杨东华王宏志
人工参与的迭代式数据清洗方法研究
2023年
数据采集技术的进步导致了数据集规模的飞速上涨,由于数据的大规模和高复杂性引起了严重的数据质量问题,数据清洗是数据活动中必要且重要的环节。为了在保证清洗准确率的情况下有效地降低人工标注成本,提出了一种人工参与的迭代式的数据清洗方法(IDCHI)。该方法在检测模块中提出了数据选择优化方法,使分类器在初始阶段就拥有较高的准确度;并进一步提出了待人工标注数据选择方法,有效地降低人工标注的数据量。实验结果表明该方法可有效且高效地清洗错误数据。
刘一达丁小欧王宏志杨东华
关键词:数据清洗迭代式
TKEP:海量数据上一种有效的Top-K查询处理算法被引量:18
2010年
在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理top-k查询,从而适合于随机读受限或不可能的场合.文中详细地分析了NRA算法的执行行为,确定了增长阶段和收缩阶段中每个文件需要扫描的元组个数.文中发现在海量数据环境中,NRA在增长阶段需要维护大量的候选元组,严重影响了算法的执行效率.所以,文中提出一种新的海量数据上的top-k查询算法TKEP,该算法在查询的增长阶段就执行早剪切,从而大大减少增长阶段需要维护的候选元组.文中给出了早剪切操作的数学分析,确定了早剪切操作的理论和实际剪切效果.据作者所知,该文是第一篇提出在top-k查询的增长阶段执行早剪切的文章.实验结果表明,和传统的NRA相比,TKEP在增长阶段维护的元组数量减少3个数量级,需要的内存量减少1个数量级,TKEP算法获得1个数量级的加速比.
韩希先杨东华李建中
关键词:海量数据TOP-K
RB树:一种支持空间近似关键字查询的外存索引被引量:9
2012年
空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给定阈值.随着当前数据的爆炸性增长,空间数据库无法完整地存放在内存中,因此空间数据库需要支持空间近似关键字查询的外存索引.目前,还没有在外存中支持精确的空间近似关键字查询的索引结构.设计了一种新型的外存索引RB树,在外存中支持精确的空间近似关键字查询.RB树支持的空间近似关键字查询包括多种空间条件,如范围查询、NN查询,同时支持多种关键字相似性度量,包括编辑距离、规范化编辑距离等.通过真实数据中的性能测试验证了RB树的效率.
王金宝高宏李建中杨东华
关键词:空间数据库关键字查询处理索引外存
RM树:一种支持字符串相似性操作的索引被引量:6
2011年
字符串相似性操作在很多领域中被广泛应用,如数据清洁、信息集成等.现有研究工作主要为基于q-Gram和倒排索引的内存方法,在处理大量数据时具有以下缺点:内存消耗大、更新效率低、支持操作类型有限.现有的外存索引Bed树无法将相似的字符串聚类,在查询处理过程中导致了较大的I/O代价.该文设计了支持多种字符串相似性操作的RM树索引,消除了现有内存方法的缺点,并通过字符串聚类的方法提高了相似性操作的效率.该文通过大量实验结果证明了RM树的有效性.
王金宝高宏李建中杨东华
关键词:字符串索引查询处理
RB树:一种支持空间近似关键字查询的外存索引
空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给...
王金宝高宏李建中杨东华
关键词:空间数据库关键字查询处理索引外存
文献传递网络资源链接
面向知识图谱的图嵌入学习研究进展被引量:9
2022年
知识图谱是一种用网络结构存储知识的知识库,在知识图谱中,单条知识被表示成三元组的形式,即(头实体,关系,尾实体).得力于知识图谱在各个领域的广泛应用,面向知识图谱的图嵌入学习也得到越来越多研究人员的关注.面向知识图谱的图嵌入学习任务旨在为图谱中的实体与关系学习低维且稠密的向量,通过图嵌入向量表达实体与关系的语义信息以及度量实体之间、关系之间、实体与关系之间的语义联系,已有许多研究证明图嵌入模型在下游任务中的有效性.近年来,越来越多研究人员开始关注知识图谱的图嵌入学习,并取得大量的研究成果,尝试将图嵌入算法分成了基于转移思想、基于张量分解、基于传统深度学习模型、基于图神经网络以及融入额外信息的图嵌入学习共5大类,梳理、介绍各类图嵌入算法的设计思路、算法特征以及优缺点,以帮助指导初步接触该领域的研究人员快速学习了解该研究领域的相关模型和算法.
杨东华何涛王宏志王金宝
关键词:知识图谱链接预测
共3页<123>
聚类工具0