张彦霞
- 作品数:31 被引量:94H指数:7
- 供职机构:中国科学院国家天文台更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:天文地球自动化与计算机技术自然科学总论电子电信更多>>
- 基于自动聚类算法(AutoClass)的恒星/星系分类被引量:8
- 2009年
- 自动聚类算法(AutoClass)是一种非监督的能对复杂数据进行精确的自动聚类的有效分类方法,可以事先设定好类别数目让AutoClass自动寻找,在寻找结束后,能够得到每一条数据分别属于每一类别的几率,这样可以根据专业知识,选出比较好的分类效果.描述了使用AutoClass对SDSS DR6的恒星/星系测光数据进行分类,将868974条测光数据进行处理,通过去离群数据和自动聚类的方法,将最终的812613条数据分成两类,其中星系和恒星的数据分别是680361和126988条.对于去掉离群后的数据,星系和恒星的分类正确率分别达到99.51%和98.52%,表明AutoClass算法对去掉离群数据后的恒星/星系数据分类有很好的效率.因此,可以将该算法应用于天文中的其他分类问题,另外基于该算法的非监督性,可以帮助天文学家去掉离群数据或发现一些特殊天体.
- 严太生张彦霞赵永恒李冀
- 关键词:恒星星系数据分析
- 海量星表融合系统(XMaS_VO)的设计与开发被引量:2
- 2008年
- 将不同波段的星表、特别是巡天项目产生的大型星表进行交叉证认,一直是进行多波段天文学研究,尤其是数据挖掘、统计分析研究的瓶颈。本文开发和实现了一个不依赖于特定数据库的海量星表融合系统(简称为XMaS_VO),用户能够方便地使用此系统的服务进行星表的上传及自动入库、交叉证认等工作。此外,XMaS_VO具备可移植性,如果用户需要进行很大数量的或者大型星表的交叉证认服务,可以自己建立数据库,方便地将此工具移植到自己的服务器上,自己使用或者开放服务给他人。随着该系统的进一步发展和应用,天文学家将可以轻松自如地获得他们需要的多波段融合数据,自由地选取参数和匹配的结果,从而可以更加有效地从事海量数据处理和分析工作。
- 高丹路勇张彦霞赵永恒
- 关键词:数据处理数据挖掘
- 虚拟天文台的科学意义被引量:6
- 2004年
- 阐述了虚拟天文台的科学目标和一些基于虚拟天文台的成功范例及其优越性,以此显示创建虚拟天文台和构想新的研究范例的必要性,同时也说明虚拟天文台是由需求带动发展,并逐步由虚拟变为现实的研究途径。作为21世纪新的研究平台,虚拟天文台将在知识和技术等方面对天文学家提出新的挑战,提供新的机遇。
- 张彦霞赵永恒
- 关键词:天文学虚拟天文台数据分析数据挖掘可视化
- 数据挖掘技术在天文学中的应用被引量:7
- 2011年
- 天文学成为数据异常丰富的学科,与信息技术的融合催生了天文信息学。信息技术在天文学中的交叉应用,可以大大促进天文学的发展。本文介绍了一些大型巡天项目,描述了天文数据的特点,给出了天文数据挖掘的必要性,重点介绍了天文学中数据挖掘任务、常用的数据挖掘技术并分析了它们的优缺点,以及一些天文数据挖掘应用和天文数据挖掘项目。也指出了天文数据挖掘面临的挑战。
- 张彦霞赵永恒
- 关键词:天文学巡天数据挖掘聚类
- 多波段巡天和LAMOST观测目标被引量:1
- 2004年
- 综述了国际上多波段巡天工作的进展。其中,X射线波段列举了至今主要的X射线卫星,特别介绍了ROSAT、ASCA、Chandra和XMM—Newton的情况;光学波段主要介绍了SDSS、DEEP以及2df的星系和类星体巡天;红外波段主要介绍了2MASS和SWIRE巡天;射电波段主要介绍了NVSS和FIRST巡天。根据光谱能力和观测模式,提出了LAMOST的选题目标,分析讨论了LAMOST可以开展的交叉证认工作。
- 何香涛陈阳李丹丹赵永恒张彦霞
- 关键词:天体物理学LAMOST
- 多波段天体物理中的自动分类方法研究
- 该文中我们提出了两种方案用来研究天体在多维参数空间中的分布.第一种方案:利用多波段数据,用自动的分类方法支持矢量机(SVM)和学习矢量量化(LVQ)对天体分类,对比了采用两个波段数据与三个波段数据的分类结果,发现随着波段...
- 张彦霞
- 关键词:数据分析星表
- 文献传递
- Python多核并行计算在海量星表交叉证认中的应用被引量:3
- 2011年
- 天文学研究中经常需要通过交叉证认将来自多波段多项目天文数据联系起来统一考虑.当前天文数据急剧增长,必然导致交叉证认的速度过慢.针对这一问题,提出一种在多核环境下使用Python语言进行高效并行计算的方法,与以往的研究结果相比,速度提高了若干倍.这为下一步的多波段数据统计研究和数据挖掘打下了良好的基础.
- 裴彤张彦霞彭南博赵永恒
- 关键词:天文星表巡天数据库并行计算PYTHON
- 天体匹配方法、天体匹配装置及计算集群
- 本公开提供了一种天体匹配方法。该方法包括:获取第一星表文件和第二星表文件,其中第一星表文件包括与多个第一天体相对应的多个第一天体标识以及与每个第一天体对应的至少一个特征数据,第二星表文件包括与多个第二天体相对应的多个第二...
- 李长华崔辰州张彦霞
- 虚拟天文台的技术进展被引量:8
- 2002年
- 虚拟天文台是在望远镜和探测器的研制技术、计算机网络技术取得突破性进展的条件下产生的,与最新的信息技术紧密结合成为其发展最鲜明的特点。用可扩展标记语言(简称XML)技术封装天文数据,把虚拟天文台建立在网格的体系结构之上是当今虚拟天文台技术发展的主流。按照目前虚拟天文台最具代表性的层次式体系结构分层介绍各个层次的相关技术,同时提出充分利用现有资源优势实施中国虚拟天文台计划的设想。
- 崔辰州赵永恒赵刚张彦霞
- 关键词:虚拟天文台仪器网络数据处理
- 天文学中的数据挖掘和知识发现被引量:18
- 2002年
- 综述了数据挖掘和知识发现在天文学中兴起的必然性及其近几年的发展状况、实现过程和具体任务。分析了当前天文数据的复杂性,介绍了天文学中数据挖掘的科学要求。系统地概括了近年来天文学中数据挖掘和知识发现领域研究的进展及其热点,并阐述了其所面临的挑战。天文学中的数据挖掘和知识发现的兴起将对天文学的发展起到巨大的推动作用,同时也在知识和技术等方面对天文学家提出了新的要求。另外,数据挖掘技术能否在虚拟天文台中成功应用,是虚拟天文台充分发挥作用的关键所在。
- 张彦霞赵永恒崔辰州
- 关键词:数据分析天文学数据挖掘知识发现