上海市教委科研基金(06FZ007)
- 作品数:5 被引量:13H指数:2
- 相关作者:高茂庭王正欧陆鹏李云更多>>
- 相关机构:上海海事大学天津大学中国人民解放军南昌陆军学院更多>>
- 发文基金:上海市教委科研基金国家自然科学基金上海海事大学重点学科建设项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于双词关联的文本特征选择模型被引量:1
- 2007年
- 向量空间模型(VSM)是一种常用的文本特征表示方法,它是基于特征独立性假设建立起来的,将文本看成是由一个个独立的词所构成,这些词之间互不关联,这种方法丢失了文本中词间的一些重要的关联特征信息。基于双词关联的文本特征选择模型是在VSM的基础上,选择文本中相邻的单词之间的关联信息也作为文本特征,从而能更加充分地表达文本的特征信息。实验表明,这是一种更加有效的文本特征选择方法。
- 高茂庭王正欧
- 关键词:文本挖掘聚类分析
- 基于投影寻踪降维的文本特征可视化被引量:4
- 2008年
- 利用遗传算法优化投影方向,投影寻踪模型将高维的文本特征数据投影到2~3维的低维可视化空间上,并根据高维数据在这个低维空间当中的投影特征值来反映其线性和非线性结构或特征,达到数据降维目的并实现文本数据特征可视化。不仅大大约简了文本挖掘过程的计算复杂性,还有助于在K-means聚类算法中确定初始中心点数目,提高算法精度。实验验证了这种方法应用于文本特征降维的有效性。
- 高茂庭陆鹏
- 关键词:投影寻踪降维文本挖掘遗传算法
- 一些代理签名方案的进一步改进
- 2008年
- 对两个不需要安全信道的代理签名方案进行了分析,发现它们并不满足不可伪造性。在[4]中不能抵抗原始签名人改变攻击,在[5]中原始签名人可以伪造一个有效的代理签名。提出一个改进的强代理签名方案,新方案在不增加计算复杂性的前提下,保证了签名的安全性,同时代理授权过程中仍然保持不需要安全信道。
- 黄文平高茂庭
- 关键词:数字签名代理签名伪造攻击
- 基于文档标引图模型的文本相似度策略被引量:7
- 2008年
- 文档标引图是一种基于短语的图结构文本特征表示模型,能更加全面、准确地表达文本特征信息,实现渐增的文本聚类和信息处理。该文基于文档标引图特征模型,提出文档相似度计算加法策略和乘法策略,采用变换函数对文档相似度值进行调整,增强文档之间的可区分性,改进文本聚类和分类等处理的性能,实例证明了策略的有效性。
- 高茂庭王正欧
- 关键词:文本聚类文本相似度
- 支持向量机在文本分类上的研究被引量:1
- 2009年
- 该文是对当前支持向量机在文本分类上的应用进行研究。先介绍了支持向量机的基本方法.再通过对不同方法的支持向量札分类算法的比较,进行一个总体酌描述和概括开对未来发展发向做了一个预测。
- 李云高茂庭
- 关键词:支持向量机文本分类