山西省自然科学基金(20041040)
- 作品数:12 被引量:72H指数:5
- 相关作者:李德玉王素格杨军玲胡建龙张武更多>>
- 相关机构:山西大学上海大学中国科学院更多>>
- 发文基金:山西省自然科学基金山西省科技攻关计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术社会学经济管理理学更多>>
- 自动获取汉语词语搭配被引量:16
- 2006年
- 作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度。本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果。
- 王素格杨军玲张武
- 关键词:计算机应用中文信息处理词语搭配互信息
- 基于最大熵模型与投票法的汉语动词与动词搭配识别被引量:5
- 2007年
- 提出一种基于最大熵模型和投票法的汉语动词与动词搭配识别方法.该方法通过组合目标动词与候选搭配词的上下文词性信息以及关联程度的统计信息构成5种复合特征模板,然后利用最大熵方法获得它们对应搭配识别器,最后采用最好搭配识别器占优的投票法构造组合识别器.实验结果表明,同时包含上下文词性信息和统计信息的识别器优于单纯包含上下文词性信息或统计信息的识别器,但最好搭配识别器占优的组合识别器效果更佳.
- 王素格杨军玲张武
- 关键词:搭配最大熵模型特征函数投票法
- 基于软计算技术的环境时序预测方法研究
- 环境与人类生存及健康密切相关,关于环境时序预测问题的研究不仅具有理论意义,还具有重要的现实意义.本文主要研究基于神经网络的软计算技术在环境时序建模中的应用,通过对真实世界的空气质量数据库进行仿真实验,结果表明:基于神经网...
- 王文剑梁吉业李德玉卢伟真
- 关键词:环境预测神经网络
- 文献传递
- 遥感信息处理不确定性的可视化表达被引量:8
- 2006年
- 如何全面、准确地度量和可视化表达遥感信息处理中不确定性的程度和空间分布方式,是遥感信息不确定性研究的关键问题之一。传统的度量方法(例如误差矩阵)是将以训练样本集为基础的度量作为总分类精度的度量,而我们需要估计模型对于“样本外数据”的性能。本文首先利用信息论和粗糙集理论等度量遥感分类影像属性信息的不确定性,提出基于像元、目标和影像的遥感信息不确定性度量指标;然后分别描述了基于不同度量指标的可视化表达方式,并对我国黄河三角洲地区的Landsat TM影像进行了分类信息不确定性度量和可视化表达实验。
- 李三平葛咏李德玉
- 关键词:不确定性可视化表达
- 基于最大熵模型的汉语动词与动词搭配识别
- 句法分析一直是自然语言处理领域的一个重点和难点问题,准确的动词与动词搭配关系识别可为建立完全的句法分析奠定一定的基础。本文提出了一种基于最大熵模型的汉语动词与动词搭配识别方法,选取目标动词与搭配词的上下文词性信息及其关联...
- 王素格张武李德玉杨军玲彭其伟
- 关键词:搭配最大熵模型粗糙集理论
- 文献传递
- 基于权重函数的混合DDM算法被引量:1
- 2008年
- 高层体系结构已成为分布式仿真通用技术框架的核心,其中数据分发管理服务则为其提供了有效的数据过滤机制。目前常用的几种DDM算法,如基于区域的算法、基于网格的算法和简单混合的算法(基于网格的DDM和基于区域的DDM混合使用)等都存在着一些不足。基于权重函数的混合DDM算法是在简单混合的DDM算法基础上加入了对路经空间中所划分网格的权重函数设立机制和对冗余信息、虚假信息的控制机制。实验结果表明,该算法在减少算法执行时间,尤其是降低网络中的数据传输量和减少组播地址消耗方面,体现出良好的性能,进一步满足了系统的可扩缩性要求。
- 张贵生张霞李德玉
- 关键词:高层体系结构数据分发管理权重函数
- 动词与动词搭配评价体系阈值定量分析
- 2006年
- 针对以往凭经验给出的搭配强度、离散度、均值、Z值的阈值等不足,利用统计方法计算动词和出现在其后的动词之间的关联程度,以自动获取动词与动词搭配。利用定量分析的方法对于不同的语料规模,以及搭配评价指标间的关系,给出了确定的阈值范围,为后续自动建立动词词语搭配知识库,提供了进一步研究的基础。
- 彭其伟王素格
- 关键词:阈值选取语料库动词搭配
- 科技项目完成情况的模糊综合评价研究被引量:9
- 2008年
- 对照科技项目合同的预定目标,提出了一种评判科技项目完成情况的模糊综合评价方法.对定量指标,提出的改进对比打分公式(contrasl evaluation formula,CEF)不仅能体现超额工作的贡献,同时能够通过指标的互补性适度地体现额外贡献.本文还提出了指标赋权的动态调整方法以解决评价过程中遇到的指标不完整问题.通过对实际科研项目的评价,验证了该方法的有效性.
- 梁吉业褚成缘胡建龙李德玉
- 关键词:科技项目评价
- 停用词表对中文文本情感分类的影响被引量:24
- 2008年
- 本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究。实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副词外的其余词语作为停用词表以及不使用停用词表对情感分类作用较大,得到的分类结果比较好;总体上,采用信息增益和布尔型权重进行中文文本情感分类的效果较好。
- 王素格魏英
- 关键词:停用词文本情感分类支持向量机