林原 作品数:54 被引量:254 H指数:9 供职机构: 大连理工大学 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学研究基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 一般工业技术 更多>>
融合专利表示的技术路线图构建研究 被引量:4 2021年 [目的/意义]通过对专利数据进行定量分析,结合深度学习方法对专利文本进行表示,构建技术路线图,弥补技术路线图易受专家主观认识限制的问题。[方法/过程]提出一种基于深度学习的技术路线图构建方法,通过专利文本表示构建专利聚类;提出专利簇技术主题生成算法及语义距离计算方法,融合时间信息和领域知识生成技术路线图。[结果/结论]选取冠状病毒领域专利进行实证研究,依据所提出的方法构建冠状病毒领域技术路线图。充分发挥技术路线图效用对相关技术发展进行探究,并提出有利疫情防治的相关建议。 林原 张乐 丁堃 许侃关键词:专利数据 技术路线图 冠状病毒 一种基于位置优化的排序学习方法 被引量:2 2012年 如何设计有效的相关性排序函数是信息检索研究的一个核心问题,因为排序函数直接影响着搜索结果的质量。排序函数的好坏一般由信息检索评价方法进行评估,对其进行优化的主要困难是这些方法都依赖于结果文档的排序位置,因此对于查询的结果返回列表中相关文档的位置的研究是十分重要的。通过探索相关文档和不相关文档之间的偏序关系构造新的输入样本;该样本是由一个相关文档和一组不相关文档所构成的,它能够更加有效的区分文档的相关性;基于该输入样本,通过定义位置损失函数对排序结果进行优化。在公开数据集Letor3.0的上的实验结果显示该方法可以将多种排序评价方法的准确率平均提高2%,证明了所提出的方法的有效性。 林原 林鸿飞 张平关键词:信息检索 基于似然损失函数的组样本排序学习方法 被引量:1 2017年 组样本用于模型训练,为排序学习方法的构造提供一种新的思路.文中改进已有的组样本排序学习方法,构造组样本损失函数,用于排序学习模型的训练.基于似然损失函数,采用样本偏序权重损失函数和最优初始序列选择方法,构造基于神经网络的组排序学习方法,实验证明文中方法能够有效提高排序准确率. 林原 徐博 孙晓玲 林鸿飞 许侃关键词:信息检索 一种面向代码检索的查询扩展方法 一种面向代码检索的查询扩展方法,包括:A、语料采集和预处理;B、初次检索获取候选扩展词;C、查询扩展词集提取;D、基于扩展查询的二次检索。本发明基于查询词与扩展词的共现信息和扩展词在代码文件内的分布信息实现有效的面向代码... 林鸿飞 徐博 林原文献传递 一种基于机器学习的药物推荐方法、电子设备和计算机可读存储介质 本发明涉及一种基于机器学习的药物推荐方法、电子设备和计算机可读存储介质,属于标签分类领域,为了解决药物推荐模型DDI偏高的问题,机器学习模型根据所述核心病情向量及所述全局药物向量,以及所述医学信息,得到模型输出;根据阈值... 王健 李若冰 林鸿飞 林原面向学术评价的论文画像研究 被引量:4 2022年 [目的/意义]在回归论文本身内容的基础上,结合定性定量两种方法以构建科学、全面且智能的学术论文评价方法。[方法/过程]文章以论文画像为载体,基于论文自身信息、以同行评议为代表的定性评价信息与以引用和Altmetrics为典型的定量评价信息对学术论文评价信息进行全面的刻画。通过为每篇论文构建画像,并使用基于深度学习的方法对不同类型论文画像进行学习,构建学术论文质量自动分类模型进行综合评价。[结果/结论]应用论文画像使学术评价回归论文本身,同时辅之以定性和定量评价的属性特征,可以完善论文评价机制并达到论文质量可视化的目的。学术论文质量分类模型也提升了论文评价的智能性和时效性。 丁堃 赵昕航 林原 林鸿飞关键词:论文评价 综合评价 论文质量 基于情感常识的微博事件公众情感趋势预测 被引量:12 2017年 微博日益成为一个巨大而复杂的互联网舆论平台。分析微博中特定话题的情感趋势对于了解网络舆情、分析产品销量趋势显得尤为重要。该文使用微博进行真实事件公众情感趋势预测:首先,考虑到微博特征稀疏、上下文缺失的特性,借助词语上下位语义关系对其进行语义扩充;其次,使用语义特征和情感常识知识构造双层分类方法进行情感分析;最后,对特定事件在连续时间段内的微博使用时序情感分析方法进行公众情感趋势预测。实验证明,该情感分析方法准确率相对于传统分类方法有明显的提高,在此基础上的情感趋势预测符合事件的真实发展状况。 任巨伟 杨亮 吴晓芳 林原 林鸿飞关键词:情感分析 学术论文审稿效用研究——以国际会议ICLR同行评议为例 2022年 【目的】基于国际表征学习会议(International Conference on Learning Representations,ICLR)同行评议的文本分析,利用自然语言处理方法探索同行评议中审稿意见效用的评估方法。【方法】首先定义审稿效用的概念,然后对审稿文本进行标注,应用表示学习与深度学习模型提出一种审稿效用度智能识别方法。【结果】所提出的智能识别方法能够快速、有效地进行分析,获得审稿文本的效用度。负面审稿意见以及录用论文对应的审稿意见的审稿效用更高,论文水平与审稿专家经验是审稿效用的重要决定因素,中国审稿专家的审稿水平可能与世界平均水平相当。【结论】应用审稿效用度智能识别方法能够及时发现异常的审稿文本,辅助编委和编辑做出审稿最终决定,改善同行评议评价结果,进而健全同行评议机制。 赵昕航 丁堃 孙曰君 张春博 林原 高成锴关键词:同行评议 文本分析 语言模型在信息检索中的应用 被引量:4 2011年 基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容易推演出其他经典的检索模型。此外,大量的实验结果表明,该方法的检索效果优于其他检索模型,因而一经提出便受到了广大研究人员的青睐。然而当前语言模型方法的研究主要集中在单语检索任务中,很少有研究关注语言模型方法在跨语言检索中的应用,针对这个问题,本文在系统介绍基于语言模型检索方法的基础上,将语言模型方法扩展到跨语言检索任务中,介绍了两个跨语言检索模型:统计翻译模型和跨语言相关语言模型。 苏绥 林原 林鸿飞关键词:统计语言模型 跨语言信息检索 技术科学的历史表现形态及启示 被引量:2 2022年 人类社会的进步源于科技体系的建立和发展,其中,现代工程技术科学在科学技术体系中的地位已经被认可和重视。钱学森基于科学与技术互动而提出的技术科学思想,对于科技体系发展仍具有重要的指导意义。技术科学作为现代科技体系中的"桥梁",是推进工程技术进步、带动基础科学发展的重要纽带。一套完整的现代科学技术体系是孕育和支撑颠覆性科技创新的根本,先进的技术科学对于提高一个国家的科技实力意义非凡。从历史的视角,追溯了自17世纪培根提出的"自然哲学实践论"以来技术科学的5个发展阶段,即"以科学和实验为基础""基于产业的科学""打上军工烙印的科技""以技术域为特征"和今天的"多学科工程技术的会聚融合"。梳理技术科学的历史形态变化,对于理解当今中国科技发展是有启发意义的:(1)将高质量发展的产业转型升级需求作为技术科学研究的战略导向;(2)建立新型研发机构来承担技术科学的研究任务;(3)完善与现代工程和技术科学发展相匹配的学科布局和教育体系。 陈悦 林原关键词:思想渊源