您的位置: 专家智库 > >

蔡兵

作品数:50 被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 50篇中文专利

领域

  • 2篇自动化与计算...
  • 1篇文化科学

主题

  • 30篇网页
  • 11篇浏览
  • 8篇文本
  • 7篇索引
  • 7篇网页信息
  • 6篇互联网
  • 6篇分词
  • 5篇数据库
  • 5篇向量
  • 5篇计算机
  • 4篇预设
  • 4篇浏览器
  • 4篇网页数据
  • 4篇文本内容
  • 4篇相关度
  • 4篇链接
  • 4篇互联网技术
  • 4篇关键词
  • 4篇服务器
  • 3篇信息推送

机构

  • 50篇深圳市腾讯计...

作者

  • 50篇蔡兵
  • 8篇徐羽
  • 4篇张凯
  • 2篇黄钰

年份

  • 1篇2020
  • 5篇2019
  • 12篇2018
  • 2篇2017
  • 1篇2016
  • 9篇2015
  • 16篇2014
  • 4篇2013
50 条 记 录,以下是 1-10
排序方式:
网页信息处理方法及装置
本发明的实施例提供一种网页信息处理方法及装置,涉及计算机技术领域,包括:对原始网页进行特征识别,得出各特征的取值;根据所述各特征的取值判断所述原始网页是否为目标网页;当判断出所述原始网页为目标网页时,从原始网页中提取目标...
蔡兵
文献传递
网页正文中图片的提取方法及装置
本发明公开了一种网页正文中图片的提取方法及装置,属于计算机技术领域。所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大...
蔡兵张凯徐羽
文献传递
网页URL过滤方法、装置及系统
本发明涉及一种网页URL过滤方法、装置及系统,其方法包括:获取预先收集的同一网页的URL数据集;当URL数据集中包含多个URL时,对URL数据集中的每一URL进行字段拆分及分析;根据字段拆分及分析结果,去掉其中的无关字段...
蔡兵
文献传递
一种网页类型识别方法和系统
本发明实施方式提出一种网页类型识别方法和系统。方法包括:根据网页的文本内容计算该网页的内容类型倾向值;提取该网页的网页结构特征;利用该内容类型倾向值和该网页结构特征识别网页的类型。应用本发明实施方式之后,综合考虑了文本内...
蔡兵彭默徐羽
文献传递
一种网页数据的分类方法、装置和系统
本发明实施例公开了一种网页数据的分类方法和装置。本发明实施例采用获取分类树,针对该分类树中每个类别在原始网页数据集合选择至少一个网页数据,作为每个类别对应的聚类初始中心点,然后根据该少量的聚类初始中心点对原始网页数据集合...
蔡兵
文献传递
一种摘要生成方法及装置
本发明实施例公开了一种摘要生成方法及装置,其中方法的实现包括:获取正文内容并获取所述正文内容的句子;对正文内容的各句子使用多元语言模型算法进行分词得到分词结果,确定所述分词结果的特征向量;所述特征向量包含典型特征,典型特...
蔡兵
WAP页面的结构化显示方法及装置
本发明公开一种WAP页面的结构化显示方法及装置,该显示方式包括:接收页面浏览请求,获取该页面浏览请求所请求的原始页面;对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;将所获得的结构化字段...
蔡兵
文献传递
网页链接的存储方法及服务器
本发明提供一种网页链接的存储方法及服务器,所述方法包括:根据索引标识获取待分析网页;对所述待分析网页进行分块处理,形成至少一个的网页链接块;判断所述网页链接块是否符合预设的关联标准,其中所述关联标准用于判断所述网页链接块...
蔡兵
文献传递
网页识别方法及网页识别装置
本发明提供一种网页识别方法及网页识别装置,该网页识别方法包括根据预定词汇数据库,获取网页标题中的预定词汇;根据预定词汇数据库中的预定词汇的加权值,生成网页标题的第一识别值;以及根据预设的第一阈值和网页标题的第一识别值,对...
蔡兵
文献传递
一种网页数据存储方法及装置
本发明涉及一种网页数据存储方法,包括以下步骤:当接收到一目标网页集合对应的网页数据的存储请求时,判断指定的存储空间是否足够存储该目标网页集合对应的网页数据;当该存储空间不足够存储该目标网页集合对应的网页数据时,预估与该存...
蔡兵
文献传递
共5页<12345>
聚类工具0