袁小龙
作品数: 25被引量:48H指数:6
  • 所属机构:中国科学院过程工程研究所
  • 所在地区:北京市
  • 研究方向:理学
  • 发文基金:国家自然科学基金

相关作者

李晓霞
作品数:123被引量:283H指数:10
供职机构:中国科学院过程工程研究所
研究主题:REAXFF MD GPU 分子动力学 INTERNET
郭力
作品数:127被引量:297H指数:10
供职机构:中国科学院过程工程研究所
研究主题:REAXFF MD GPU 并行计算 INTERNET
聂峰光
作品数:43被引量:97H指数:7
供职机构:中国科学院过程工程研究所
研究主题:GPU 化学信息学 传染性法氏囊病病毒 REAXFF MD
夏诏杰
作品数:23被引量:37H指数:4
供职机构:中国科学院过程工程研究所
研究主题:搜索引擎 化学信息学 PORTAL 文本自动分类 化学数据库
唐武成
作品数:7被引量:13H指数:2
供职机构:中国科学院过程工程研究所
研究主题:PORTAL 数据提取 化学信息学 化学数据库 搜索引擎
基于XML的化学深层网数据提取模板生成工具
分布在 Internet 上的化学数据库是宝贵的化学信息资源,化学深层网是这类数据库的集合,化学深层网检索的目标是利用一个查询,实现多个化学数据库数据的同时检索和数据集成。基于 XML 的化学深层网数据提取方法是通过构造...
卓流艺李晓霞袁小龙郭力
关键词:XML化学数据库
文献传递
基于XML的半结构化化学信息提取系统的重构与优化
ChemDB Portal 系统是基于 XML 技术面向多个远程化学数据库的半结构化数据采集引擎。该系统通过单一检索入口同对多个远程化学数据库发送针对不同数据库构造的查询请求,并将返回的包含半结构化数据的页面分别转化为结...
袁小龙刘增才李晓霞郭力
文献传递
深层网技术在专利数据提取中的应用被引量:1
2011年
深层网技术是获取隐藏在以表单为特征的网络数据库检索入口后的数据页面的提取技术,解决了通用搜索引擎不能有效索引深层网网页的问题。专利数据是一类重要的深层网数据资源,对其进行提取、挖掘具有重要意义。本文利用深层网技术开发了一个专利检索系统,实现了对中国和美国专利数据的本地检索、提取和下载,以及针对中国专利的法律状态检索。该软件支持专利的批量下载及文件管理,并根据中国和美国专利显示为多个单页TIFF格式图片不利于本地管理和浏览的特点,开发了实用性较强的TIFF格式图片多页合并和通用PDF格式转换功能。该专利检索系统采用面向用户的界面设计和功能开发,具有简单、易用的特点。
袁小龙李晓霞郭力
关键词:批量下载
GPU桌面机上的大规模分子动力学高性能计算
李晓霞郑默刘忠亮陶晓芳刘健袁小龙聂峰光郭力
关键词:GPU
利用ChemDB Portal检索化学深层网
<正>Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,检索网络化学信息资源的工具也从化学浅层网向化学深层网发展。中国科学院过程工程研究所高性能计算与
李晓霞袁小龙夏诏杰井银铃聂峰光唐武成郭力
关键词:化学数据库搜索引擎化学信息学
文献传递
化学信息门户ChIN十年回顾被引量:3
2007年
中国科学院过程工程所(原化工冶金所)自1997年开始建立和维护的Internet化学化工资源导航系统ChIN,目前作为国家科学数字图书馆:化学学科信息门户运行,它是一个集Internet化学资源的发现、收集、分类、描述,门户网站导航系统的生成和向Web发布、用户集成交流环境等功能较为完善的化学化工门户系统。ChIN已经在Internet上连续不间断地运行了约10年时间。目前与国际上知名的同类系统如ChemDex、Links for Chemists等相比,无论从索引的资源总量、内容质量、还是系统的整体性能上。ChIN都毫不逊色。本文回顾了ChIN在这10年中工具与版本的发展、运行的概况、及被访问的情况等。
李晓霞袁小龙聂锋光郭力
关键词:INTERNET
反应分子动力学(ReaxFF MD)模拟结果分析工具VARxMD被引量:9
2014年
反应分子动力学(ReaxFF MD)是一种很有潜力研究较大体系(>1000个原子)复杂化学反应的方法.国际上现有的ReaxFFMD模拟结果分析工具无法让用户了解所模拟的过程中发生的化学反应细节,对于规模小或简单的反应体系进行人工分析还可以接受,但对于原子规模达到~1000-~10000的大体系模拟,反应分析功能的缺乏,将使研究者对反应机理的分析陷入困境.本文研发的反应分子动力学分析与可视化工具VARxMD(Visualization and Analysis of ReaxFF Molecular Dynamics),它是国际上第一个实现对ReaxFF MD模拟轨迹进行化学反应自动分析的工具.VARxMD是基于Qt/VTK和其它第三方库研发的跨平台图形用户界面程序,借助化学信息学的化学结构处理方法,对ReaxFF MD模拟结果轨迹中的原子、物种、成断键的分析,并结合数据可视化和分子片段结构可视化,实现对ReaxFF MD模拟结果的深度分析,可获得模拟过程中完整的化学反应信息.VARxMD已应用于煤热解和聚乙烯等复杂分子体系热解的化学反应机理探索,且VARxMD具有通用性,有望被应用于更多的体系.
刘健李晓霞郭力郑默韩君易袁小龙聂峰光刘晓龙
关键词:化学反应机理化学信息学
Internet上多来源MSDS的统一检索方法被引量:8
2009年
国际上称之为材料安全数据表的MSDS是一份关于化合物安全信息的综合性法律文件。随着人们安全意识的提高以及对职业健康、环境保护等认识的不断深入,MSDS作为一个安全信息文件越来越受重视。由于制作MSDS需要一定的成本,充分利用网络上免费的MSDS数据对于了解化合物的安全信息具有重要的参考价值。已有针对MSDS的搜索工具,一般只能检索单一来源的MSDS数据库,所以建立一个能通过一个查询同时检索多个来源数据库的MSDS搜索引擎,将为使用MSDS的人员提供极大方便。本文提出建立MSDS统一搜索引擎的框架,通过链接分析技术和深层网数据检索技术获取MSDS文件,然后缓存各数据源检索结果,并建立化合物索引以提高MSDS搜索引擎的响应速度。其实现过程包括发现与自动构造检索式模式、自动获取检索结果页面、利用数据提取的方法获取化合物标识信息以建立MSDS的化合物索引等多个方面,为建立一个可用的MSDS统一搜索引擎奠定坚实基础。
李海波李晓霞袁小龙郭力
关键词:MSDS搜索引擎数据提取
一种面向化学深层网的移动可变数据窗提取技术
网络上的免费化学数据库资源网站一般属于化学深层网范畴,其数据页面隐藏于以表单为特征的网站检索入口之后为动态生成或独立存在的网页。这些化学数据页面无法通过超链接分析被通用搜索引擎索引和检索,具有形式统一、数据规范的特点。为...
袁小龙李晓霞郭力
关键词:数据提取XML
大规模化合物子结构检索的并行实现与优化被引量:7
2010年
化合物的子结构检索在计算机辅助药物设计、波普学、化学数据库等领域是不可或缺的工具。然而由于子结构检索是一个NP完备性的问题,获得用户可接受的平均检索时间一直是研究人员十分关注的问题,其方法主要有改进算法和提升硬件条件2个方面。当化学结构数据库的规模达到百万乃至千万级别时,尽管改进算法的方式能够获得一定的检索效率提升,但其提升的空间有限,因而,集群并行方式是大规模化合物子结构检索应用的必然选择。本文以ChemDB Portal的化学子结构检索系统为基础,实现了基于集群并行的化学子结构检索系统,并进行了任务均分、多线程并行等优化。在包含800万个化合物结构的化学结构数据库中,利用5个节点的小型集群,选取10个较为典型的提问结构进行子结构检索测试。测试结果为基于集群的化学子结构检索的平均检索时间由初始单节点时的34.1 min降低为2.75 min,检索效率平均提高12.4倍,表明在大规模乃至超大规模的数据条件下,集群并行化方式能够显著地提高子结构检索系统的执行效率。
井银玲李晓霞袁小龙郭力
关键词:集群并行化学数据库化学信息学