周津
- 作品数:11 被引量:59H指数:4
- 供职机构:中国科学技术大学信息科学技术学院多媒体计算与通信教育部—微软重点实验室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信经济管理更多>>
- 基于Web企业竞争对手情报自动搜集平台被引量:13
- 2004年
- 从互联网中准确有效及时地自动搜索出需要的信息,是Web信息处理中的一个重要研究课题。本文在所提出的基于搜索路径Web网页搜索和基于多知识网页信息抽取方法基础上,给出基于Web企业竞争对手情报自动收集平台的实现方法,该平台可以有效地从多个企业门户网站中,自动搜索出所需要的目标网页,并能够从目标网页中自动抽取其中多记录信息。本文利用该平台进行了企业人才招聘信息的自动搜索实验。实验结果证实了该平台在信息自动搜集方面的有效性和准确性。
- 朱明王胜周津
- 关键词:企业门户网站搜索引擎WEB企业信息化
- 采用对象特征向量表示法的标签聚类算法被引量:8
- 2012年
- 在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.
- 周津陈超俞能海
- 关键词:特征向量K-MEANS余弦相似度
- 基于击键特征的用户身份认证新方法被引量:18
- 2002年
- 口令保护机制是绝大多数计算机及网络安全管理中的重要一环。如何有效防止因口令失窃而造成计算机及网络系统的非法进入,一直是一个倍受关注的问题。为此文章提出了一种利用用户口令输入击键特征进行用户身份认证的新方法。该方法利用人在点击键盘时所产生的按键压力和击键频率,构造出能够描述每个用户独有特征的击键特征向量,并由此提出了一种基于有限正例样本集合识别正反例的新算法。相关实验结果表明该身份认证新方法具有较高的用户识别能力。
- 朱明周津王继康
- 关键词:击键特征用户身份认证生物特征计算机安全计算机网络网络安全
- 标签聚类方法和系统
- 本发明实施例公开了一种标签聚类方法和系统,所述方法包括:建立每一个待聚类标签的特征向量;计算两个特征向量在欧式空间的余弦夹角,得到待聚类标签两两之间的相似度;采用K-Means算法、根据待聚类标签之间的相似度对所述待聚类...
- 陈超周津俞能海
- 文献传递
- 互联网中的海量用户行为挖掘算法研究
- 随着计算机技术以及互联网的飞速发展,在Web中产生了越来越多的基于用户的应用,这些应用数年来收集了海量的用户行为数据,且数据还正以指数级增长,这些海量数据中包含了大量和用户相关的信息。及时、精确地从这些海量用户信息中发现...
- 周津
- 关键词:特征向量数据挖掘用户行为分析K-MEANS分布式MAPREDUCE
- 文献传递
- 招聘信息网页搜索的研究与实现
- 2005年
- 以互联网上招聘信息的搜索作为切入点,研究了基于主题的信息搜索技术。详细介绍了搜索系统的结构及各部分的功能和主要算法。
- 王胜钱朝阳朱明周津
- 关键词:互联网招聘信息网页信息搜索
- 网络安全信息智能搜索方法的研究
- 互联网信息智能搜索是互联网信息处理中一个重要研究课题.有效及时全面地收集互联网上网络安全信息资料,是从事网络安全研究与技术开发的工作基础.而目前的Web搜索引擎,或其它Web信息搜索方法均无法帮助完成这一任务.为此在我们...
- 朱明周津郑全
- 关键词:网络安全智能搜索
- 文献传递
- 基于XML的网页信息自动抽取被引量:15
- 2004年
- 文章提出了一种基于XML的网页信息自动抽取的方法和框架 ,通过利用网页中信息的结构相似性和词法相似性 ,自动学习出网页信息的记录模式并归纳出相应的词法模式 ,从而避免了繁重的人为样本收集与标记工作 ,也免去了人工给定模式的工作 ,具备很强的自动性。同时自动归纳出的词法模式还可以应用到其他网站和非结构化文本中。
- 周津朱明郑全
- 关键词:信息抽取XMLWWW
- 基于XML的网页信息抽取
- 随着互联网的迅猛发展,'信息过载'已经成为一个亟待解决的问题.为了使用户准确获取他想要的信息,信息抽取成为必要.从网页中抽取信息的程序称为Wrapper.关键的任务是:Wrapper的构造要尽可能快速,不需要过多人为地参...
- 周津
- 关键词:信息抽取互联网XML
- 文献传递
- 电信综合网管数据模型有效实现方法的研究被引量:2
- 2005年
- 针对电信综合网管数据模型实现效率低下问题 ,本文分别给出其数据模型基于关系数据库、面向对象数据库、对象关系数据库的有效实现方法 ;并对这三种不同数据库实现的操作性能进行了比较与分析。有关的试验结果表明 。
- 尹大成周津朱明张学敏林高全
- 关键词:电信管理网络综合网络管理网络资源数据模型数据库