为了解美国国防领域对人类语言技术的研究应用情况并探究其对我相关技术领域的启示,以美国国防先进研究项目局(defense advanced research project agency,DARPA)自成立以来的人类语言技术项目为研究对象,全面、系统地研究其在该领域的设计思想、进展及目标。其关注点可分为语音识别、机器翻译、信息检索、语言资源建设、语言技术评测及多元整合系统开发等六类。从上述类别的数量分布、预期目标及应用构想来看,DARPA人类语言技术研究的最终指向是高效率、高适应、高智能的信息检索与利用,旨在拓展美军行动范围,精简行动参与人数,提升行动速度,而其在该领域的大胆创新和紧贴实际军事任务需求的特点值得借鉴。
提出了一种基于情感词典和概念层次网络(hierarchical network concepts,HNC)语境框架的文本情感倾向性分析方法,将文本的情感倾向分析分为两个阶段:特征词、语句和句群判定阶段;基于HNC语境框架的句与句群情感分析阶段。首先以How Net情感词典和自建的形容词配价词典(valency dictionary of English adjective,VDEA)作为基础词典资源进行文本特征词匹配,在此基础上基于HNC语境框架进行文本的情感倾向性判定,融合情感词典资源与HNC语境框架的独特优势,从特征词语情感分析入手,以包含特征词的语句及句群为情感分析重点,进而确定文本的情感倾向性,体现了HNC"有所为有所不为"的思想。为验证方法的有效性,文本分别对政治、经济、体育与影视评论等领域文本进行测试,从实验结果可以看出商品评论以及影评类的文本情感识别率相对较高,而政治与体育类识别率低,但基本达到了预期实验效果,从而验证了本方法的可行性。