您的位置: 专家智库 > >

戴震宇

作品数:16 被引量:15H指数:2
供职机构:贵州大学更多>>
发文基金:国家自然科学基金贵州省教育厅自然科学研究项目贵州省科技计划项目更多>>
相关领域:自动化与计算机技术文化科学经济管理更多>>

文献类型

  • 12篇期刊文章
  • 3篇专利

领域

  • 13篇自动化与计算...
  • 1篇经济管理
  • 1篇文化科学

主题

  • 5篇数据库
  • 3篇可视化
  • 3篇分布式
  • 2篇用户
  • 2篇用户自定义
  • 2篇用户自定义函...
  • 2篇语句
  • 2篇数据可视化
  • 2篇数据挖掘
  • 2篇索引
  • 2篇索引技术
  • 2篇自定义
  • 2篇自定义函数
  • 2篇集群存储
  • 2篇分布式并行
  • 2篇分布式并行计...
  • 2篇分布式并行数...
  • 2篇并行计算
  • 2篇并行数据
  • 2篇并行数据库

机构

  • 15篇贵州大学
  • 3篇中国科学院国...
  • 1篇贵州联科卫信...
  • 1篇航天江南集团...

作者

  • 15篇戴震宇
  • 14篇李晖
  • 14篇陈梅
  • 2篇朱明
  • 1篇杨庆
  • 1篇韩文彪
  • 1篇朱明

传媒

  • 4篇计算机与现代...
  • 3篇计算机与数字...
  • 1篇计算机工程与...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇中国新通信
  • 1篇教育文化论坛

年份

  • 1篇2022
  • 4篇2021
  • 1篇2020
  • 1篇2019
  • 4篇2018
  • 2篇2017
  • 1篇2016
  • 1篇2014
16 条 记 录,以下是 1-10
排序方式:
SNS:一种快速无偏的分层图抽样算法
2018年
抽样作为一种有效的统计分析方法,常被用于大规模图数据分析领域以提升性能。现有的图抽样算法大多存在高度节点或低度节点过度入样的问题,较大程度地影响了算法的性能。复杂网络具有无标度特性,即节点的度服从幂律分布,节点个体之间存在较大差异。在基于点选择策略的抽样方法的基础上,通过结合节点的近似度分布策略,设计并实现了高效无偏的分层图抽样算法SNS。在3个真实的图数据集上的实验结果表明,SNS算法比其他图抽样算法保留了更多的拓扑属性,且执行效率比FFS更高。SNS算法在度的无偏性、抽样结果拓扑属性近似性方面的表现均优于现有算法。
朱君鹏李晖陈梅陈梅
关键词:分层抽样
基于电信数据仓库的客户流失分析被引量:1
2021年
互联网背景下,网络通信与人们的生活密不可分。电信运营的服务目标是广大客户,客户流失分析一直是各大电信运营商关注的焦点之一。随着通信行业的迅速发展,电信运营记录了大量的历史数据,这既为客户流失的分析提供了原始凭证,更为客户服务业务的调整提供了方向。电信数据仓库技术能够为电信运营商的客户分析提供强大的技术基础与资料支撑,提高客户资源的分析小效率。当前,电信数据仓库在客户流失管理中仍然存在着一系列问题亟待解决。为了进一步提高对客户流失的分析,构建出基于电信数据仓库的客户流失分析新架构,从而最大程度提高电信运营的管理。
戴震宇
关键词:电信数据仓库客户流失
DoFFT:一种基于分布式数据库的快速傅里叶变换方法被引量:1
2018年
快速傅里叶变换在天文学中有着广泛的应用。例如,脉冲星信号通常需要基于快速傅里叶变换进行相干消色散处理。由于信号数据通常存储在数据库中,而将数据从数据库取出后再由外部程序进行快速傅里叶变换处理将产生大量I/O和网络开销进而严重影响整体处理性能。针对此问题,本文设计一种用户自定义函数(UDF)形式的可在分布式数据库中并行执行和优化快速傅里叶变换的算法DoFFT(Database optimized FFT)。此外,针对数据库集群中每台机器负载不同、数据分布不均匀等有时会导致执行效率低下的问题,DoFFT方法基于CPU、I/O,网络与传输速率等的代价,对涉及的数据进行数据重分布处理,以进一步优化快速傅里叶变换的并行执行。实验结果表明,采用基于数据重分布的优化后,DoFFT算法的性能得到了有效提升。
季朋李晖陈梅陈梅
关键词:分布式数据库快速傅里叶变换数据分布
DRVisSys:基于属性相关性分析的可视化推荐系统被引量:2
2018年
数据可视化通常是展示数据价值最有效的方式。针对大规模复杂多维数据,对相关数据子集进行分析并将分析结果自动映射成合适的可视化展现模式,是一项需要大量迭代计算的复杂技术工作。设计并实现了DRVis Sys系统,该系统根据属性关联分析技术推荐出合适的可视化展现模式;其对于非平凡属性组合的选择,采用典型关联算法计算出更优的属性集。考虑到各属性权重在实际生活中是有区别的,采用层叠隐马尔可夫算法计算各属性权重,将属性权重作为非平凡属性组的评测标准之一。为使得推荐出的可视化展现模式能更好地满足用户需要,DRVis Sys系统能根据用户反馈,更新可视化推荐模型。实验结果表明,DRVisSys能够快速进行数据分析并为用户推荐出合适的可视化展现模式。
吴小全李晖陈梅戴震宇
关键词:数据可视化
VISDMiner:一个交互式数据挖掘过程可视化系统被引量:3
2018年
针对数据挖掘中挖掘过程不透明以及用户交互少的问题,本文设计并实现了VISDMiner系统。VISDMiner系统将可视化技术和数据挖掘技术结合在一起,提供对挖掘过程中各阶段产生的可视化子结果集的分析。用户可根据自己的领域知识和经验去调整数据挖掘算法模型的参数和可视化模型的参数,促进算法和挖掘分析过程的有效调优。为了处理高维数据集,VISDMiner系统采用一种基于最大信息系数的主成分分析改进算法MIC-PCA,该算法主要是针对传统PCA算法降维能力和分类准确率低的问题进行改进。实验结果表明,VISDMine不仅实现了数据挖掘过程的可视化,还提高了用户对数据挖掘执行结果的可理解性,其采用的改进的MIC-PCA算法提高了PCA算法的降维能力和分类准确率。
王永胜李晖陈梅陈梅朱明
关键词:数据挖掘可视化技术交互性可视化数据挖掘主成分分析
一种面向海量天文数据的存取优化系统
本发明公开了一种面向海量天文数据的存取优化系统,采用Greenplum分布式并行数据库集群存储海量天文数据,所述存取优化系统包括:数据库集群模块、构建模块、扫描模块和客户端,所述客户端用于输入查询语句以及显示查询结果,所...
李晖戴震宇陈梅梁青青
DF-SSD:一种基于反卷积和特征融合的单阶段小目标检测算法被引量:1
2021年
针对经典的单阶段多目标检测算法SSD对小目标物检测效果差的问题,提出DF-SSD算法,其核心技术贡献包括基于反卷积与特征融合的方法和改进后的先验框尺寸计算算法。反卷积与特征融合能够增加浅层特征层的语义信息。改进后的先验框尺寸计算引入了数据集的特点,能有效利用每一个先验框进行训练和预测。改进后的方法DF-SSD与基于SSD改进的R-SSD和RSSD模型相比,具有较高的检测准确率。同时,DF-SSD的检测时间仅是R-SSD的1/2,是DSSD的1/5。改进后的方法在VOC2007和DIOR这2个数据集上的MAP比SSD分别提升了1.4和3.6个百分点。其中ship、vehicle、windmill、cat这4类小目标的MAP分别提升了23.2、12.6、8和4.8个百分点。结果表明:DF-SSD方法有效提高了小目标物的检测正确率,并且具有较快的检测速度。
王良玮陈梅李晖李焕军施若戴震宇
关键词:反卷积小目标检测DIOR
一种面向工作负载预测的基于小波变换的特征提取方法被引量:1
2020年
在资源受限条件下,根据数据挖掘任务在执行过程中实时产生的资源和任务状态来准确地预测任务执行时间是非常重要的。为有效地使用时间序列数据实现准确预测,提出一种降载策略来确定预测的切入点和数据处理方案。该策略使用动态时间规整(Dynamic Time Warping,DTW)距离度量子序列与整个序列之间相似度的变化以确定用于预测的数据,然后利用小波变换计算小波系数并提取小波系数的能量值作为预测的特征,最后预测任务执行时间。实验结果表明,该方法提取的特征信息包含原序列较多信息,在预测任务执行时间方面具有较高的准确性。
王可李晖陈梅陈梅朱明
关键词:降载小波变换特征提取
一种面向海量天文数据的存取优化系统
本发明公开了一种面向海量天文数据的存取优化系统,采用Greenplum分布式并行数据库集群存储海量天文数据,所述存取优化系统包括:数据库集群模块、构建模块、扫描模块和客户端,所述客户端用于输入查询语句以及显示查询结果,所...
李晖戴震宇陈梅梁青青
文献传递
ADCS:一种基于SSD的阵列数据库缓存技术被引量:1
2017年
论文提出了在阵列数据库中引入固态硬盘作为Cache的内存-SSD-磁盘的多级存储架构,研发了以阵列数据库的存储单元chunk为粒度的缓存技术—ADCS,并在FASTDB中进行了实现。ADCS采用最近最少使用(LRU)算法作为缓存淘汰算法,得益于内存和磁盘之间的SSD cache构建技术,阵列数据库的查询性能提升了34%左右。
杨庆李晖陈梅戴震宇朱明
关键词:二级缓存ADCSLRU
共2页<12>
聚类工具0