何婷婷 作品数:144 被引量:829 H指数:18 供职机构: 华中师范大学 更多>> 发文基金: 国家自然科学基金 湖北省自然科学基金 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 语言文字 理学 更多>>
基于树型正交前向选择方法的可调核函数模型 2011年 基于留一准则的正交前向选择算法(Orthogonal Forward Selection based on Leave-One-Out Criteria,OFS-LOO)是最近提出的一种数据建模方法,它能够产生鲁棒性好的参数可调的核函数回归模型。OFS-LOO采用贪婪算法策略,利用全局优化算法逐项调节每个回归项的参数,逐步地增加模型的项数,减少留一准则函数值。但是OFS-LOO仅保留当前最优解作为新回归项的参数,而忽略当前的选择对以后步骤的影响,破坏了模型的稀疏性。本文在OFS-LOO的框架下提出了一种新颖的树型算法。在选择核函数模型的每一项时,采用重复加权增进搜索(Repeated Weighted Boosting Search,RWBS)算法,同时保留RWBS得到的多个局部极值作为核函数参数的候选项。新方法试图找到传统OFS-LOO和全局最优解之间的折衷。实验表明,与传统方法相比,新方法得到的核函数模型稀疏性更好,泛化能力更强。 张猛 付丽华 何婷婷 魏志成基于语料库和网络的新词自动识别 被引量:21 2004年 汉语自动分词是进行中文信息处理的基础。目前 ,困扰汉语自动分词的一个主要难题就是新词自动识别 ,尤其是非专名新词的自动识别。同时 ,新词自动识别对于汉语词典的编纂也有着极为重要的意义。文中提出了一种新的新词自动识别的方法。这个方法用到了互信息和log likelihoodratio两个参数的改进形式。主要分三个阶段完成 :先从网络上下载丰富的语料 ,构建语料库 ;然后采用统计的方法进行多字词识别 ;最后与已有的词表进行对照 ,判定新词。 刘建舟 何婷婷 骆昌日关键词:页面解析 一种基于神经网络的中文问答系统 本发明公开一种基于神经网络的中文问答系统,包括有用户接口模块、问题预分词模块、神经元预标注模块、学习训练模块、神经元知识库模块、语义块识别模块、问题集索引模块和答案推理模块。通过该系统,首先采用SIE编码方式,对语义块内... 何婷婷 张茂元 陈龙 张勇 胡泊 张红春 吴宝珍 刘星星文献传递 基于排序学习的文本概念标注方法研究 被引量:2 2013年 提出一种基于排序学习的方法 CRM(concept ranking model),来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注,建立训练集合,然后利用排序学习算法在多项特征上得到对概念排序的模型,利用这个概念的排序模型对任意文档进行概念标注。实验表明,相对于传统的文档概念标注方法,此方法在各类指标上都有相当大的提高,标注结果更加接近人类的概念标注。 涂新辉 何婷婷 何婷婷 王建文关键词:维基百科 一种蛋白质复合物识别方法 本发明公开了一种蛋白质复合物识别方法,其将蛋白质基因表达数据、GO功能注释数据及其相互作用数据进行整合,构建了多源动态蛋白质网络,然后基于局部密度与相对距离对蛋白质节点进行聚类,并对初始的蛋白质复合物聚类模块基于聚类偏好... 沈显君 蒋兴鹏 胡小华 何婷婷 周锦 解丹文献传递 一种文本分割技术的多文档文摘方法研究 被引量:2 2014年 提出一种基于文本分割技术的多文档自动文摘方法。该方法使用HowNet作为概念获取工具,通过建立句子概念向量空间模型和利用改进的DotPlotting模型来进行文本分割。利用建立的句子概念向量空间模型计算句子重要度,并根据句子重要度、文本分割结果和文摘句相似度等因素产生文本摘要。使用ROUGE-N评测方法和F_Score作为评测指标对系统产生的文摘进行评测,结果显示使用文本分割技术进行多文档摘要是有效的。 王萌 唐新来 何婷婷关键词:文本分割 自动文摘 HOWNET 面向查询的多模式自动摘要研究 被引量:4 2011年 为了满足用户的个性化需求,提供尽可能丰富、实用、方便的文摘结果,该文设计了面向查询的多文档自动文摘的多种摘要模式。在将查询返回的文档集合表示为以文本、段落为节点的双层复杂网络结构以发现子主题的基础上,除传统的摘要模式外,该文又设计了概括摘要、局部摘要、全局摘要和详细摘要这四种摘要模式,并给出了各种摘要的生成方法。支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息。 李芳 何婷婷基于超空间模拟语言的增强伪相关反馈模型信息检索方法 本发明提供一种基于超空间模拟语言的增强伪相关反馈模型信息检索方法,包括对初始用户查询词Q检索反馈前N篇文档,用初始反馈的前N篇文档中所有词作为候选扩展词,采用超空间模拟语言模型,根据候选扩展词和初始查询词的位置距离,计算... 何婷婷 潘敏 应志为 张悦文献传递 网络语言的特点及其情感性意义 被引量:18 2015年 网络语言是在网络交际中产生,并在网络空间里得以广泛传播的新型交际语言。方便、快捷的网络交际的现实需求决定了网络语言简洁、形象、随意、创新的特点。通过对网络语言情感性的界定及其特点的分析,研究了网络语言情感用语传播的变化规律;网络语言情感用语的传播受到社会、技术更新等因素的影响;其传播受众多,影响广泛,为公众搭建了一个可以宣泄内心情感的载体平台,促进了网络交际的大众化与多元化发展,对网际交往具有重要意义。 骆昌日 何婷婷关键词:网络语言 网际交往 情感性 一种基于深度学习的情绪原因识别方法及系统 本发明提供一种基于深度学习的情绪原因识别方法及系统,首先,将一段文本D中的情绪d<Sub>e</Sub>与这段文本中的任意语句组合构成新的文本数据D<Sub>cp</Sub>;然后用新的文本数据D<Sub>cp</Sub... 何婷婷 范瑞 王逾凡 章哲铭 洪婕 戴汝峰 阿布都乃比江·库尔班文献传递