陈清才
- 作品数:9 被引量:39H指数:4
- 供职机构:哈尔滨工业大学深圳研究生院更多>>
- 发文基金:国家自然科学基金黑龙江省杰出青年科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 一种基于粗糙集的大规模语料库语言学知识发现模型被引量:2
- 2004年
- 文中首先通过语言学特征表来对文本信息进行结构化处理 ,同时实现了对远距离约束的表示 ;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息 ,并利用规则抽取算法过滤特征表中不一致的部分 ,从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后 ,本文研究了模型在汉语词义排歧以及音字转换中的应用 ,在采用了动态规则平滑算法后 ,分别获得了 0 .93和 0 .95的判别精度以及 0 .92和 0 .89的覆盖率 。
- 陈清才王晓龙赵健
- 关键词:粗糙集音字转换
- HowNet与维基百科知识融合中的义类属性自动构建方法
- 本文提出了一种开放语义知识库构建方法来融合《知网》和以Wikipedia为代表的百科全书,保留《知网》中的语义信息和Wikipedia中的丰富资源及其知识框架,通过在两种知识库间建立一个映射关系,构造了一个大规模、带有语...
- 崔磊陈清才郭鸿志王晓龙
- 关键词:语义知识库WIKIPEDIA
- 文献传递
- 通过全局核降低高斯核的局部风险与基于遗传算法的两阶段模型选择被引量:2
- 2007年
- 支持向量分类时,由于样本分布的不均匀性,单宽度的高斯核会在空间的稠密区域产生过学习现象,在稀疏区域产生欠学习现象,即存在局部风险.针对于此,构造了一个全局性次核来降低高斯核产生的局部风险.形成的混合核称为主次核.利用幂级数构造性地给出并证明了主次核的正定性条件,进一步提出了基于遗传算法的两阶段模型选择算法来优化主次核的参数.实验验证了主次核和模型选择算法的优越性.
- 常群王晓龙林沂蒙Daniel S.Yeung陈清才
- 关键词:支持向量机高斯核
- 弹性波与单侧界面裂纹相互作用问题的边界元法被引量:6
- 2000年
- 借助边界元法设计了一种迭代修正方法来求解单侧界面裂纹模型与弹性波的相互作用问题,作为对算法的检验,用这种方法我们具体地分析了平面简谐弹性波对一个单侧界面裂纹的入射,给出了裂纹面的接触形态及应力场.
- 盖秉政陈清才
- 关键词:弹性波相互作用
- 基于粗集的汉语建模及其应用研究
- 该文通过引入粗集技术,探索从大规模非结构化的自然语言文本中自动获取语言学规则的方法与模型,研究借助粗集技术来考察自然语言建模的特点以及建模过程中所面临的主要问题、相应的解决方法,在此基础上,进一步研究所建立的语言模型在自...
- 陈清才
- 关键词:粗集自动文摘
- 基于逆向运动学与关键帧技术的中国手势语言表达系统
- 王轩陈清才王明江王宇曾龙辉范士喜李露卢家锐张芳思李媚霖郑浩廖达民高宁周昭愚韩丽姣
- 基于逆向运动学与关键帧技术的中国手势语言表达系统是国家科技部科技型中小企业创新基金项目,是由广州市德山通信设备有限公司和哈尔滨工业大学深圳研究生院共同完成开发,实现了产品的生产和销售。该系统是由机器翻译系统、拼音字典、手...
- 关键词:
- 关键词:逆向运动学机器翻译系统
- 基于最大频繁项集的搜索引擎查询结果聚类算法被引量:5
- 2010年
- 现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类,由于网页摘要篇幅较短,质量良莠不齐,聚类效果难以有较大的提高(比如后缀树算法,Lingo算法);而传统的基于全文的聚类算法运算复杂度较高,且难以生成高质量的类别标签,无法满足在线聚类的需求(比如KMeans算法)。该文提出一种基于全文最大频繁项集的网页在线聚类算法MFIC(Maximal Frequent Itemset Clustering)。算法首先基于全文挖掘最大频繁项集,然后依据网页集合之间最大频繁项集的共享关系进行聚类,最后依据类别包含的频繁项生成类别标签。实验结果表明MFIC算法降低了基于网页全文聚类的时间,聚类精度提高15%左右,且能生成可读性较好的类别标签。
- 苏冲陈清才王晓龙孟宪军
- 关键词:中文信息处理搜索引擎网页聚类频繁项集
- 弹性波与单侧界面裂纹相互作用问题的边界元解法
- 该文研究了另一种较接近裂纹实际的单侧界面裂纹模型与弹性波的相互作用问题.由于存在有不等式约束条件,要精确求解这一问题是很困难的,为此作者设计了一种迭代修正的方法,并运用边界元法来获得这一问题的数值解.文中主要研究了在简谐...
- 陈清才
- 关键词:弹性波边界元法
- 一种基于词矢量的汉语语义量化模型被引量:20
- 2001年
- 通过建立基于词矢量的汉语语义量化模型来解决语义信息的自动获取及量化问题 ,描述了模型的建立方法及其在汉语词义排歧中的应用 ,最后通过构造伪词的方法对模型的语义辨识能力进行了评测 .实验表明该语义量化模型具有很好的语义表示能力 ,并且由于模型的建立是通过对大规模生语料库的统计来完成的 ,避免了人工对词语语义进行量化时所需的庞大工作量 。
- 陈清才王晓龙
- 关键词:自然语言处理语料库人工智能