陈晋川 作品数:17 被引量:88 H指数:5 供职机构: 中国人民大学信息学院 更多>> 发文基金: 国家自然科学基金 国家重点实验室开放基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 更多>>
基于CoP建模的信息过滤技术研究 目前越来越多的企业采用信息管理或知识管理系统来提高工作效率,在这样的系统中,企业员工实际在虚拟的协作环境下工作,他们需要得到与自己工作任务相关的及时有效的信息支持.传统的信息过滤技术仅根据用户的兴趣来作信息过滤和推荐,难... 陈晋川关键词:信息过滤 COP 向量空间模型 文献传递 数据挖掘与软件企业知识管理技术 张晓刚 李文杰 李雄锋 陈晋川 董颖 梁晟 付弘宇 董斐 赵万磊 高颖 仲原 该项目是国家自然科学基金项目,其研究目标是:探索基于Internet/Web的分布式环境下,用户主导的需求获取与协同机制、方法,建立相应的应用原型系统。研究用户主导的需求获取框架,以及分层次的多用户协同机制 ;建立和使用...关键词:关键词:数据挖掘 知识管理 文科学生信息素养与计算思维能力的培养思路研究--以“网页设计”课程建设为例 被引量:1 2020年 从文科学生的信息素养与计算思维能力培养的角度,探索相关课程的设计。以“网页设计”课程为例,通过分析该课程的培养目标和终极使命,在培养目标指导下,结合课程内容与学生知识结构进行具体的课程设计和建设,分享了课程建设的成果和经验,并对未来教学工作进行展望。 曹巍 王璞巍 陈晋川 战疆 尤晓东 王秋月关键词:信息素养 计算思维 万维网 网页设计 文科学生 基于虚拟教研室的数据库分层教学探索 2024年 针对目前数据库教学设计不能适应多类型数据库人才培养的问题,分析了研究型、综合型和应用型三类数据库人才培养的需求和定位,以教育部数据库课程虚拟教研室为载体,展开了数据库分层教学的探索。针对不同类型的数据库人才培养,设计了三份数据库教学大纲,明确了各自的培养目标、教学内容和教学用时。基于这三份教学大纲,分别建设了相应的课件、教案、题库以及实验设计,并研发了相应的配套平台。探讨了基于虚拟教研室开展共同备课,让不同类型的数据库教学可以相互借鉴,共同提高。 陈晋川 焦敏 杜方 车蕾 陈红关键词:分层教学 数据库 教学大纲 基于Nash-Pareto策略的自动数据分布方法及支持工具 被引量:2 2015年 大数据时代的来临为数据存储与管理提出了新的挑战.随着数据量的迅猛增加,自动数据分布逐渐成为分布式系统中的研究重点和难点.根据对数据分布问题中数据、负载和节点3个要素的研究和分析,将数据分布问题抽象为称为DaWN(data,workload,node)的三角模型,并将3要素之间的相互关联关系抽象为数据分片、数据分配和负载执行3条纽带;据此,提出了解决自动数据分布问题的基本架构,对各功能模块的协动关系进行探讨;同时,结合已有的研究工作,采用Nash-Pareto优化均衡策略使得前述各机制相得益彰,实验结果验证了其有效性.为使研究工作更多地应用于实践,设计并实现了自动数据分布辅助原型工具ADDvisor(automatic data distribution advisor),协同支持自动数据分布的执行,共同促进大规模分布式联机事务处理系统的并行性能和自动化管理技术的发展. 王晓燕 陈晋川 郭小燕 杜小勇关键词:数据分布 自动化解决方案 联机事务处理 政府治理大数据的共享、集成与融合 被引量:18 2020年 为支持政府治理方法科学化、过程智能化、结果精细化,政府治理大数据共享、集成与融合不能局限于提供数据访问接口,而是要从语义层面发现实体、找出关联关系以及演化过程。然而,政府治理大数据的多源、异构、动态、海量、孤岛化特性却使之面临严峻挑战。系统性回顾了大规模分布式异构数据共享、集成、融合的基础理论和方法,并指出了构建面向政府治理大数据的高可信共享、高精准集成、高效率融合技术的迫切性。 金澈清 陈晋川 刘威 张召关键词:政府治理 数据共享 数据融合 数据集成 FusionDB:基于分布式查询引擎和HDFS的SPARQL查询处理系统 被引量:1 2015年 近年来,互联网上的RDF三元组数量增长迅速,传统的单机SPARQL查询处理技术已不能满足实际需要.现有的分布式SPARQL查询处理系统可以分为2类,基于Hadoop的,或是基于数据库集群的.前者主要采用Map?Reduce来处理查询,效率较低;后者则继承了传统数据库集群的缺陷,可扩展性较差.提出一个新颖的SPARQL查询处理系统FusionDB.该系统采用分布式查询处理引擎和HDFS,这样既可以受益于传统的分布式数据库技术,如分布式连接、流水线、负载均衡等,又从新兴的Hadoop技术中得到了良好的容错能力和高可扩展性.为了进一步加速查询处理的效率,FusionDB还在HDFS文件上增加了注入式索引.实验表明,相比于传统的系统,FusionDB在性能上具有明显的优势. 高阳 何龙 侯佳佳 陈晋川 杜小勇关键词:SPARQL 查询重写 HDFS 索引 软件过程技术与质量保障平台 王青 胡清华 王建昌 李怀璋 何川 武占春 雷辉 蒋晖 周津慧 于磊 刘瑞刚 淮晓永 李牧 陈晔 张晓刚 赵欣培 姜楠 杨秋松 李娟 薛云志 袁峰 刘霞 董斐 肖俊超 周辉 童立靖 刘经纬 解凡 刘旸 杨宗奎 王巍 廖渊 邓涛 余珂 王绍恒 朱丹枫 该成果提出了一个开放集成软件过程服务框架,形成一个融合过程、人(资源)和开发技术三个方面的、开放的软件过程服务集成管理体系。研制开发的具有开放性和灵活性的软件质量保证平台可支持CMM、CMMI、ISO9000、ISO15...关键词: 语义Web技术与Ontology 于磊 梁晟 李娟 张晓刚 杨秋松 吴锐 王绍恒 陈晋川 孙勇 该项目是本实验室承担的国家863课题。主要研究和探索支持语义Web技术的语义Web语言和结合语义Web技术的Web服务。在目前主流语义Web语言DAML+OIL和OWL的基础上扩展表达规则的能力;完善Web服务的语义描述...关键词:关键词:语义WEB WEB服务 ONTOLOGY 云计算环境中面向OLTP应用的数据分布研究 被引量:10 2016年 云计算为大型OLTP应用中分布式数据的高效存储和管理带来了新的机遇,大数据则对分布式数据的存储与管理提出了新的挑战,自动数据分布逐渐成为分布式系统中的研究重点和难点.该文对影响数据分布问题的三要素数据、负载和节点进行分析,将该问题抽象为数据分片、数据分配和负载执行3个相互关联的子问题,提出了数据分布问题的三角架构DaWN.由于不同的系统有不同的应用需求,DaWN架构以代价模型为枢纽,对特定应用需要达到的效能目标和资源限制进行调配,并提出了数据分布问题所面临的技术挑战.该文对DaWN架构中以顶点为代表的3个基本要素进行详细分析,着重对以边为代表的3条关联关系进行阐释,并据此对云环境中大规模OLTP应用的数据分片、数据分配和负载执行3个数据分布子问题的研究成果和进展进行归纳和总结.基于以上分析,该文以数据分片、数据分片和负载执行为变量,使用真值表覆盖数据分布问题中的8种类型,并采用三维立体坐标系的方式对相关工作的分布进行归纳总结和呈现.最后,该文从代价模型研究、测试基准研究、自动化数据分布技术研究、特定应用研究等4个角度,对数据分布问题的未来发展方向进行展望. 王晓燕 陈晋川 杜小勇关键词:数据分布 数据分片 数据分配 OLTP 大数据