您的位置: 专家智库 > >

王玉琢

作品数:5 被引量:54H指数:4
供职机构:南京理工大学经济管理学院信息管理系更多>>
发文基金:国家社会科学基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 4篇文化科学
  • 1篇自动化与计算...

主题

  • 2篇学术
  • 1篇学术论文
  • 1篇学术影响
  • 1篇学术影响力分...
  • 1篇学术专著
  • 1篇引文
  • 1篇语料
  • 1篇语料库
  • 1篇语料库构建
  • 1篇情报
  • 1篇情报学
  • 1篇文本
  • 1篇命名实体识别

机构

  • 5篇南京理工大学
  • 3篇南京大学

作者

  • 5篇章成志
  • 5篇王玉琢
  • 1篇卢超

传媒

  • 2篇情报学报
  • 1篇图书情报工作
  • 1篇情报工程
  • 1篇科技情报研究

年份

  • 1篇2021
  • 1篇2020
  • 1篇2018
  • 2篇2017
5 条 记 录,以下是 1-5
排序方式:
基于学术论文全文内容的算法使用行为及其影响力研究被引量:22
2018年
数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力。具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估。实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低。本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考。
章成志丁睿祎王玉琢
情报学方法语料库构建被引量:7
2020年
情报学领域的学术论文全文中包含了大量的方法实体,识别并分析这些方法实体可帮助学者更好地了解该学科,并找到适合自身研究工作的方法。从学术文献全文中自动抽取方法实体的基础是高质量的方法语料库,为此,文章提出了一种情报学方法实体标注框架,并在此基础上开展情报学方法语料库构建工作。具体而言,文章采取人工阅读和人工标注的方式,首先构建了情报学领域结构化学术文献全文语料,并在此基础上通过人工标注,识别出学术文献中包含情报学方法的句子和方法实体,得到情报学方法语料库。文章表明,文章提出的语料库构建框架可较好地完成语料实体的标注工作,其结果可作为基础数据库,为情报学方法实体的自动抽取提供训练数据。
章成志王玉琢王如萍
关键词:语料库情报学
针对特定任务的方法实体评估研究被引量:2
2021年
[目的/意义]在科学的发展中,研究方法扮演着重要角色。收集并分析特定学科的方法实体,能够帮助学者更好地了解该领域的研究方法,并找到适合其自身研究的方法。目前已有针对方法抽取和评价的相关研究,但尚未针对特定任务开展知识实体抽取与评估研究。[方法/过程]本文以命名实体识别(Named Entity Recognition,NER)任务为例,从ACL Anthology网站中收集相关论文,利用内容分析法对论文中作者使用的方法实体进行标注。本文从426篇学术论文中标注出904种方法实体。并基于使用次数和使用年代两个维度来评估方法实体影响力。[结果/结论]条件随机场是NER任务中影响力最大的算法,神经网络算法在近五年发展迅猛;学者倾向于使用算法而不是现成的工具进行实体识别;在数据选择方面,经典数据集是学者的首选;F值、正确率和召回率是影响力最大的评价指标。本文的标注结果能够帮助学者更好地理解该任务,提高科研的效率。实体评估的结果能够为初学者在选择具体研究方法时提供参考。
李小乐王玉琢章成志
关键词:命名实体识别
考虑全文本内容的算法学术影响力分析研究被引量:20
2017年
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法 /过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。
王玉琢章成志
学术专著引用行为研究——基于引文内容特征分析的视角被引量:15
2017年
当前的引文内容分析研究基本上以学术论文为研究对象。与学术论文相比,学术专著的篇幅较长、引文内容更加翔实。学术专著的引文内容特征分布对学术专著的引文内容分析方法、乃至引用行为与动机等研究都具有重要的意义。本文首先通过对Morgan&Claypool出版的39本学术专著的引文内容进行人工标注,构建包含13539条引文内容的学术专著引文内容分析语料;然后分别从引文内容位置分布、引文提及次数以及引文内容上下文特征等三个方面分析学术专著的引文行为,并针对不同学科学术专著的引用行为特点进行了总结;最后本文讨论了学术专著与学术论文引文内容特征分布的差异,并指出进行学术专著引文内容分析时应注意的问题。本文研究成果可以帮助学者进一步了解学术专著引用行为的特点,并为后续的学术专著中的引文动机研究打下基础。
章成志王玉琢卢超
关键词:学术专著
共1页<1>
聚类工具0