AAAI Conference on Artificial Intelligence (AAAI) 是人工智能领域的顶级会议。近期,AAAI2023会议录用结果公布,本次会议共收到8777篇有效投稿,最终录用1721篇,录用率为19.6%。浙江省服务机器人重点实验室博士生邢航笛的表格结构识别论文《LORE: Logical Location Regression Network for Table Structure Recognition》被AAAI2023录用为全文。
随着光学字符识别(Optical Character Recognition, OCR)技术的不断发展,对于含表格文档的OCR、表格抽取的需求逐渐增加。表格结构识别是指将图片中的表格内容提取为电子设备中结构化存储的数据。
当前的主流方法是基于邻接关系挖掘或生成标记文本序列的。他们都忽略了重要的表格逻辑坐标。现有的一些着眼于逻辑坐标的解决方案由于没有建模逻辑坐标之间的关系(如互斥关系),在较难的基准数据集(比如实拍数据、历史文献数据等)上无法得到令人满意的效果。本文提出了基于层次化的回归器的端到端表格结构识别模型,深度挖掘了逻辑坐标之间的内部关联,提升了模型的表现;并去除了各种定制化的前后处理,简化了模型的训练和推理流程。实验表明,我们的模型在各种基准数据集上都能达到相当或超越当前的基线模型的效果。
论文、模型代码和相关模型参数将在Github仓库公开,仓库地址为: https://github.com/AlibabaResearch/AdvancedLiterateMachinery。