李岩
- 作品数:28 被引量:41H指数:5
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:中央级公益性科研院所基本科研业务费专项资金项目国家自然科学基金国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术经济管理更多>>
- 基于社区隶属度的文本主题可视化方法、装置
- 本申请实施例提供了一种基于社区隶属度的文本主题可视化方法、装置。该方法包括:获取待处理文本的主题词以及主题词的共现信息;确定主题词的社区划分结果;基于共现信息以及社区划分结果,确定各主题词的社区隶属度;基于共现信息以及各...
- 李岩高影繁刘志辉崔笛浦墨郑明
- 文献传递
- 基于政社舆情的公众关注与政策关注差异分析
- 2022年
- 本文分析公众关注与政策关注的差异性。利用从《国家重点支持的高新技术领域》文件的第二大类高新技术领域文本中提取出的关键技术主题词,检索并分析相关舆情数据。发现民众对“生物与新医药”领域的关注点主要集中在“医药生物技术”“医疗仪器、设备与医学专用软件”以及“化学药研发技术”这三个技术领域。相较于政策内容关注的重点而言,民众关注的内容更贴近民生。
- 姚新浦墨李岩高影繁刘志辉
- 文本相似性分析方法、装置、电子设备及计算机存储介质
- 本申请涉及文本处理领域,公开了一种文本相似性分析方法、装置、电子设备及计算机可读存储介质,其中,文本相似性分析方法包括:确定目标文本的第一预设个数的基础特征词;接着基于训练后的文本词向量库,对第一预设个数的基础特征词分别...
- 高影繁姚长青刘志辉崔笛李岩郑明
- 文献传递
- 专利与企业相关性测度方法、装置、设备及可读存储介质
- 本申请实施例提供了一种专利与企业相关性测度方法、装置、设备及可读存储介质。该方法包括:获取企业专利文本中的专利特征词;确定各专利特征词在企业专利文本中的权重值;根据企业专利文本所属企业的企业描述文本,以及专利特征词,确定...
- 高影繁刘志辉姚长青李岩崔笛郑明
- 文献传递
- 基于分类体系的上市公司年报信息披露质量研究——以我国A股上市公司为例被引量:9
- 2019年
- 随着信息化进程的加快和大数据时代的到来,数据和信息已成为国家重要的战略资源,信息质量也成为影响其社会和经济价值的重要因素。目前,关于企业年报的信息质量问题正受到业界的密切关注。本研究从竞争情报分析和应用的视角出发,以国内A股上市公司年报为研究对象,通过构建上市公司年报非财务数据分类体系,开展基于分类体系的上市公司年报信息披露质量研究。研究发现,国内A股上市公司年报的信息披露质量正随着监管制度的反复修订和完善而逐渐提升,且以"核心竞争力"、"风险认知"和"供应链"这三类信息披露质量提升最为显著;各行业在企业竞争力分析的核心关键信息披露质量上差异较大,且以制造业及信息传输、软件和信息技术服务业的整体质量最高,而房地产业、金融业、教育等非实体经济行业和低技术附加值行业的信息质量则相对较低;在披露问题方面,主要存在供应商或客户名称较隐晦、地区表述不规范、产品名称不清晰等诸多问题。未来仍需加强相关监管和规范,尝试有针对性地建立分类模型和规范,以从根本上提高年报信息披露质量,从而更好地服务于以细粒度知识为基础的产业和企业竞争情报深度分析。
- 崔笛郑明李岩刘志辉
- 关键词:信息质量年报
- 一种面向特定领域专利实施例的命名实体识别方法
- 本申请实施例提供了一种面向特定领域专利实施例的命名实体识别方法,涉及自然语言处理技术领域。该方法包括:获取待识别数据;采用预训练的第一识别模型对待识别数据进行识别,确定与待识别数据对应的命名实体;其中,第一识别模型是基于...
- 李岩高影繁刘志辉
- 文献传递
- 专利技术核心度的确定方法、装置、电子设备及存储介质
- 本申请实施例提供了一种专利技术核心度的确定方法、装置、电子设备及存储介质,涉及数据处理领域。该方法包括:根据目标专利与预设数据库中除了目标专利之外的每项第一专利之间的相似度,确定目标申请人以及关联申请人中每个第一申请人的...
- 高影繁刘志辉李岩郑明仇实
- 文献传递
- 一种采用SpotSigs算法的中文新闻网页相似性检测方法被引量:1
- 2017年
- 互联网的高速发展使得新闻网页成为了网民了解国内外大事的首要选择,然而中国互联网存在着大量重复新闻网页的现象,对于提高用户体验以及新闻情报的分析造成了一定的困难。本文以SpotSigs算法为基础提出了一种中文新闻网页相似性检测方法,在先行词选取阶段使用基础先行词与优化先行词相结合的选择策略,从而降低了网页中的导航栏、广告等噪音对中文新闻网页相似性检测的影响。以实际的中文新闻网页为实验数据集,通过准确率、召回率两项指标验证了基于SpotSigs算法的中文新闻网页相似性检测方法的有效性和可行性,特别在相似度阈值较低的情况下具有较好的性能。
- 李岩徐硕吴广印干生洪
- 关键词:新闻网页
- 一种面向特定领域专利实施例的命名实体识别方法
- 本申请实施例提供了一种面向特定领域专利实施例的命名实体识别方法,涉及自然语言处理技术领域。该方法包括:获取待识别数据;采用预训练的第一识别模型对待识别数据进行识别,确定与待识别数据对应的命名实体;其中,第一识别模型是基于...
- 李岩高影繁刘志辉
- 风险短语识别方法、装置、电子设备及存储介质
- 本申请实施例提供了一种风险短语识别方法、装置、电子设备及存储介质,涉及文本处理技术领域。该方法包括:采用预定的短语识别算法对风险描述文本进行短语识别,得到第一风险短语列表;采用预定的分词工具对风险描述文本进行处理,得到第...
- 高影繁刘志辉姚长青李岩崔笛郑明浦墨