2023年合合信息带着智能文档处理技术亮相年度视觉与学习青年学者研讨会 (Vision And Learning SEminar, VALSE) 。VALSE是一个面向计算机视觉与机器学习领域国内外华人青年学者的高规格学术研讨会,本届会议专注于视觉知识和多重知识表达、语言文字识别与理解等技术研发及应用热点。而在信息技术高速发展的今天,随着人们对文档处理的要求越来越高,文档的智能化处理技术也备受关注。
现阶段我们常见的智能文档处理技术包含智能OCR技术、智能语音识别技术、智能文本分析技术等,通常应用于纸质文件数字化处理、快速整理分类和分析繁琐信息、合同管理、报告撰写分析、数据统计等。这项技术也是目前计算机视觉在产业中的重要应用方向,然而现阶段这项技术还面临着诸多挑战。作为智能文档处理领域的代表,合合信息在会议上进行智能文档处理技术研发与实践成果分享。
VALSE Workshop环节,合合信息技术代表就《智能文档图像处理技术应用与实践》主题进行分享
合合信息技术代表在workshop环节就OCR技术应用的拓宽带来的新挑战以及未来公司重点发力的技术方向进行了分享。他提到随着OCR技术被更广泛的应用,版面分析与文档还原技术是否能够提升文档图像电子化的视觉效果以及精准提取信息是重中之重。
随着我们面对的信息日益繁杂,需要处理的文档通常有着复杂的版面和多样化的文本内容。以一篇普通的论文为例,除文字信息外,其版面往往包含页眉、页脚、表格、二维码等多种非文字类的内容。这些都是版面分析技术在区域分割、逻辑排序方面所面临的的挑战,如何精准地辨别各类元素,并在文档电子化过程中让它们回归到应有的位置,是该项技术的难点之一。
在分享环节中,合合信息技术人员提到,文档图片的格式转化流程中,在检测、识别完出文字信息中的字符、坐标信息,以及版面中段落、印章、表格等元素信息后,机器才能“理解”文档的组成,更好地将图像“还原”成一个可编辑的Word或Excel文件。
合合信息“智能文档处理——文档还原系统架构”展示
版面分析与文档还原技术能够帮助机器‘看懂’文档结构,让文档电子化获得‘所见即所得’的处理效果。合合信息版面分析技术通过解决版面分割、区域间的逻辑关系处理等方面的难题,可将文档图像切分成不同类型内容(文本、图形、公式、表格等)的区域,并分析区域之间的关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,从各类版式复杂的图片文档中精准获取信息。
合合信息“版面分析与还原”技术处理效果展示
在全球企业和个人用户数字化、智能化服务的需求环境下,合合信息将持续升级智能文档处理技术,有效提升工作效率、促进组织和企业的数字化转型、增强智能决策能力、推动业务的自动化流程、改善用户的实际操作体验。