付翠琴
- 作品数:3 被引量:9H指数:2
- 供职机构:江西师范大学计算机信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于词项共现关系图模型的中文观点句识别研究被引量:5
- 2015年
- 不同于传统的词项间强独立性假设的词袋模型驱动的观点句识别方法,该文提出了一种新型的基于词项共现关系的图模型方法。该方法通过构建词项共现关系图模型,利用词项与词项之间的共现性和句法关系来描述词项在观点句和非观点句集合中的分布差异,同时采用基于入度的词项权重计算方法来计算词项特征值。上述研究在基准语料上进行实验,实验表明采用基于词项关系图模型方法后,中文观点句识别准确率相比目前基于词袋的方法得到显著提升。
- 王明文付翠琴徐凡洪欢
- 关键词:图模型特征值有监督学习
- 基于词项共现关系图模型的中文观点句识别研究
- 随着Web2.0的应用和普及,“以用户为中心到用户参与设计”的观点已经成为当今互联网所倡导的理念。论坛、贴吧、博客和微博等各类新型媒体为广大用户提供了更加自由交流的平台,越来越多的用户通过互联网来表达个人观点、传播思想和...
- 付翠琴
- 关键词:图模型支持向量机
- 文献传递
- 小学汉字认识量及常用字使用频度研究被引量:4
- 2016年
- 汉字生字是编写小学语文教材的主要考虑因素之一,采用计算机自动对人民网、腾讯网新闻、课外阅读语料和人教版义务教育语文教材中汉字进行统计和分析,计算出小学各年级学生的汉字认识量,并将其作为建议更新小学语文教材中常用字的依据。同时,对新闻语料和《现代汉语常用字表》中的汉字的字频、通用率和覆盖率等属性进行统计和对比,结果表明人们日常生活中的常用汉字也具有一定的时效性,给今后《现代汉语常用字表》的调整工作提供了统计学上的依据和参考。
- 罗文兵付翠琴左家莉
- 关键词:常用字语料库