宋昊苏
- 作品数:2 被引量:10H指数:1
- 供职机构:北京信息科技大学计算机学院更多>>
- 发文基金:北京市教委科技发展计划北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- “标文通”1.0API规范的研究与实现
- 2011年
- 对《中文办公软件文档格式规范》(1.0)以及《中文办公软件应用编程接口规范》进行研究分析,在NET平台上实现了一套应用程序编程接口(API),可以对UOF文档数据进行访问和修改。同时,设计并开发了一套测试案例及图形用户界面,验证了API的可用性和正确性。该套API的设计按高内聚、低耦合的原则划分模块,实现了模块间的相互调用。UOF文档应用编程接口的实现,方便了对"标文通"主要内容的脱机处理和应用集成,有利于"标文通"标准的推广应用。
- 田英爱李宁林莉宋昊苏
- 关键词:文档格式
- VSM模型在文档结构识别中的应用被引量:10
- 2011年
- 借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计算,具有较好的扩展性,可在此基础上实现其他特定结构文档格式的自动检查或文档理解。
- 宋昊苏李宁张伟
- 关键词:向量空间模型