{"id":674,"date":"2023-05-24T10:15:57","date_gmt":"2023-05-24T14:15:57","guid":{"rendered":"https:\/\/icdar2023.org\/?page_id=674"},"modified":"2023-07-31T10:19:53","modified_gmt":"2023-07-31T14:19:53","slug":"accepted-papers","status":"publish","type":"page","link":"https:\/\/icdar2023.org\/program\/accepted-papers\/","title":{"rendered":"Accepted Papers"},"content":{"rendered":"\n<h4 class=\"wp-block-heading\">Journal Track<\/h4>\n\n\n\n<p>All accepted journal track papers will have an oral presentation at the conference.<\/p>\n\n\n\n<table id=\"tablepress-papers-journal\" class=\"tablepress tablepress-id-papers-journal tablepress-accepted-papers\">\n<tbody>\n<tr class=\"row-1 odd\">\n\t<td class=\"column-1\">140<\/td><td class=\"column-2\">Large Scale Genealogical Information Extraction From Handwritten Quebec Parish Records<\/td><td class=\"column-3\">Sol\u00e8ne Tarride , Martin Maarand, M\u00e9lodie Boillet, James McGrath, Eug\u00e9nie Capel, H\u00e9l\u00e8ne V\u00e9zina, Christopher Kermorvant<\/td>\n<\/tr>\n<tr class=\"row-2 even\">\n\t<td class=\"column-1\">144<\/td><td class=\"column-2\">An Accurate Approach to Real-time Machine Readable Zone Detection with Mobile Devices<\/td><td class=\"column-3\">Alexander Gayer, Daria Ershova, Vladimir V. Arlazarov<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n\t<td class=\"column-1\">147<\/td><td class=\"column-2\">Online Handwriting Trajectory Reconstruction from Kinematic Sensors using Temporal Convolutional Network<\/td><td class=\"column-3\">Wassim Swaileh, Florent Imbert, Yann Soullard, Romain Tavenard, Eric Anquetil<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n\t<td class=\"column-1\">149<\/td><td class=\"column-2\">Classification of Incunable Glyphs and Out-of-distribution Detection with Joint Energy-based Models<\/td><td class=\"column-3\">Florian Kordon, Nikolaus Weichselbaumer, Randall Herz, Stephen Mossman, Edward Potten, Mathias Seuret, Martin Mayr, Vincent Christlein <br \/>\n<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n\t<td class=\"column-1\">150<\/td><td class=\"column-2\">Historical Document Image Analysis using Controlled Data for Pre-Training<\/td><td class=\"column-3\">Najoua Rahal, Lars V\u00f6gtlin, Rolf Ingold<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n\t<td class=\"column-1\">151<\/td><td class=\"column-2\">End-to-end Optical Music Recognition for Pianoform Sheet Music<\/td><td class=\"column-3\">Antonio R\u00edos-Vila, David Rizo, Jos\u00e9 M. I\u00f1esta, Jorge Calvo-Zaragoza<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n\t<td class=\"column-1\">154<\/td><td class=\"column-2\">Analyzing the Potential of Active Learning for Document Image Classification<\/td><td class=\"column-3\">Saifullah Saifullah, Stefan Agne, Andreas Dengel, Sheraz Ahmed<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n\t<td class=\"column-1\">158<\/td><td class=\"column-2\">LSTM-Based Siamese Neural Network for Urdu News Story Segmentation<\/td><td class=\"column-3\">Muhammad Nauman Ahmed Bhatti, Imran Siddiqi, Momina Moetesum<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n\t<td class=\"column-1\">161<\/td><td class=\"column-2\">Inv3D: A High-Resolution 3D Invoice Dataset for Template-Guided Single-Image Document Unwarping<\/td><td class=\"column-3\">Felix Hertlein, Alexander Naumann, Patrick Philipp<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n\t<td class=\"column-1\">162<\/td><td class=\"column-2\">Printed Ottoman Text Recognition Using Synthetic Data and Data Augmentation<\/td><td class=\"column-3\">Esma F. Bilgin Tasdemir<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n\t<td class=\"column-1\">163<\/td><td class=\"column-2\">IAMonSense: Multi-level Handwriting Classification using Spatio-temporal Information<\/td><td class=\"column-3\">Ahmad Mustafid, Junaid Younas, Paul Lukowicz, Sheraz Ahmed<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n\t<td class=\"column-1\">182<\/td><td class=\"column-2\">Line Extraction in Handwritten Documents via Instance Segmentation<\/td><td class=\"column-3\">Adeela Islam, Tayaba Anjum, Nazar Khan<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-papers-journal from cache -->\n\n\n<h4 class=\"wp-block-heading\">Oral Presentations<\/h4>\n\n\n\n<table id=\"tablepress-oral-papers\" class=\"tablepress tablepress-id-oral-papers tablepress-accepted-papers\">\n<tbody>\n<tr class=\"row-1 odd\">\n\t<td class=\"column-1\">286<\/td><td class=\"column-2\">Improving Information Extraction from Semi-Structured Documents Using Attention based Semi-variational Graph Auto-encoder<\/td><td class=\"column-3\">Djedjiga Belhadj, Abdel Bela\u00efd and Yolande Bela\u00efd<\/td>\n<\/tr>\n<tr class=\"row-2 even\">\n\t<td class=\"column-1\">424<\/td><td class=\"column-2\">Search for Hyphenated Words in Probabilistic Indices: a  Machine Learning Approach<\/td><td class=\"column-3\">Jos\u00e9 Andr\u00e9s, Alejandro H. Toselli and Enrique Vidal<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n\t<td class=\"column-1\">673<\/td><td class=\"column-2\">Language Independent Neuro-Symbolic Semantic Parsing for Form Understanding<\/td><td class=\"column-3\">Bhanu Prakash Voutharoja, Lizhen Qu and Fatemeh Shiri<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n\t<td class=\"column-1\">855<\/td><td class=\"column-2\">Multi-Stage Fine-tuning Deep Learning Models Improves Automatic Assessment of the Rey-Osterrieth Complex Figure Test<\/td><td class=\"column-3\">Benjamin Schuster, Florian Kordon, Martin Mayr, Mathias Seuret and Vincent Christlein<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n\t<td class=\"column-1\">897<\/td><td class=\"column-2\">SpaDen : Sparse and Dense Keypoint Estimation for Real-World Chart Understanding<\/td><td class=\"column-3\">Saleem Ahmed, David Doermann, Srirangaraj Setlur, Venu Govindaraju and Pengyu Yan<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n\t<td class=\"column-1\">910<\/td><td class=\"column-2\">DocILE Benchmark for Document Information Localization and Extraction<\/td><td class=\"column-3\">\u0160t\u011bp\u00e1n \u0160imsa, Milan \u0160ulc, Michal U\u0159i\u010d\u00e1\u0159, Yash Patel, Ahmed Hamdi, Mat\u011bj Koci\u00e1n, Maty\u00e1\u0161 Skalick\u00fd, Ji\u0159\u00ed Matas, Antoine Doucet, Micka\u00ebl Coustaty and Dimosthenis Karatzas<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n\t<td class=\"column-1\">1070<\/td><td class=\"column-2\">A Study on Reproducibility and Replicability of Table Structure Recognition Methods<\/td><td class=\"column-3\">Kehinde Ajayi, Muntabir Choudhury, Sarah Rajtmajer and Jian Wu<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n\t<td class=\"column-1\">1200<\/td><td class=\"column-2\">Key-value information extraction from full handwritten pages<\/td><td class=\"column-3\">Sol\u00e8ne Tarride, M\u00e9lodie Boillet and Christopher Kermorvant<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n\t<td class=\"column-1\">1221<\/td><td class=\"column-2\">Towards End-to-End Semi-Supervised Table Detection with Deformable Transformer<\/td><td class=\"column-3\">Tahira Shehzadi, Khurram Azeem Hashmi, Didier Stricker, Marcus Liwicki and Muhammad Zeshan Afzal<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n\t<td class=\"column-1\">1250<\/td><td class=\"column-2\">Styled Text-to-Text-Content-Image Generation with Latent Diffusion Models<\/td><td class=\"column-3\">Konstantina Nikolaidou, George Retsinas, Vincent Christlein, Mathias Seuret, Giorgos Sfikas, Elisa Barney Smith, Hamam Mokayed and Marcus Liwicki<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n\t<td class=\"column-1\">1261<\/td><td class=\"column-2\">Multi-Teacher Knowledge Distillation for End-to-End Text Image Machine Translation<\/td><td class=\"column-3\">Cong Ma, Yaping Zhang, Mei Tu, Yang Zhao, Yu Zhou and Chengqing Zong<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n\t<td class=\"column-1\">1462<\/td><td class=\"column-2\">Decoupling Visual-Semantic Features Learning with Dual Masked Autoencoder for Self-Supervised Scene Text Recognition<\/td><td class=\"column-3\">Zhi Qiao, Zhilong Ji, Ye Yuan and Jinfeng Bai<\/td>\n<\/tr>\n<tr class=\"row-13 odd\">\n\t<td class=\"column-1\">1580<\/td><td class=\"column-2\">Handwritten Text Generation with Character-specific Encoding for Style Imitation<\/td><td class=\"column-3\">Jan Zdenek and Hideki Nakayama<\/td>\n<\/tr>\n<tr class=\"row-14 even\">\n\t<td class=\"column-1\">1641<\/td><td class=\"column-2\">Relative position embedding asymmetric siamese network for Offline handwritten mathematical expression recognition<\/td><td class=\"column-3\">Chunyi Wang, Wei Hu, Xiaqing Rao, Runqi Luohu, Ning Bi and Tan Jun<\/td>\n<\/tr>\n<tr class=\"row-15 odd\">\n\t<td class=\"column-1\">1653<\/td><td class=\"column-2\">Consistent Nested Named Entity Recognition in handwritten documents via Lattice Rescoring<\/td><td class=\"column-3\">David Villanova-Aparisi, Carlos David Martinez-Hinarejos, Ver\u00f3nica Romero and Mois\u00e9s Pastor-Gadea<\/td>\n<\/tr>\n<tr class=\"row-16 even\">\n\t<td class=\"column-1\">1710<\/td><td class=\"column-2\">Optimized Table Tokenization for Table Structure Recognition<\/td><td class=\"column-3\">Maksym Lysak, Ahmed Nassar, Nikolaos Livathinos, Christoph Auer and Peter Staar<\/td>\n<\/tr>\n<tr class=\"row-17 odd\">\n\t<td class=\"column-1\">1830<\/td><td class=\"column-2\">MemeGraphs: Linking Memes to Knowledge Graphs<\/td><td class=\"column-3\">Vasiliki Kougia, Simon Fetzel, Thomas Kirchmair, Erion \u00c7ano, Sina Baharlou, Sahand Sharifzadeh and Benjamin Roth<\/td>\n<\/tr>\n<tr class=\"row-18 even\">\n\t<td class=\"column-1\">2017<\/td><td class=\"column-2\">EDSL: An Encoder-Decoder Architecture with Symbol-Level Features for Printed Mathematical Expression Recognition<\/td><td class=\"column-3\">Yingnan Fu, Tingting Liu, Ming Gao and Aoying Zhou<\/td>\n<\/tr>\n<tr class=\"row-19 odd\">\n\t<td class=\"column-1\">2113<\/td><td class=\"column-2\">TransDocAnalyser: A framework for semi-structured offline handwritten documents analysis with an application to legal domain<\/td><td class=\"column-3\">Sagar Chakraborty, Gaurav Harit and Saptarshi Ghosh<\/td>\n<\/tr>\n<tr class=\"row-20 even\">\n\t<td class=\"column-1\">2326<\/td><td class=\"column-2\">Scene Table Structure Recognition with Segmentation and Key Point Collaboration<\/td><td class=\"column-3\">Li Zhuoming, Peng Fan, Xue Yang, Ni Hao and Jin Lianwen<\/td>\n<\/tr>\n<tr class=\"row-21 odd\">\n\t<td class=\"column-1\">2427<\/td><td class=\"column-2\">ViSA: Visual and Semantic Alignment for Robust Scene Text Recognition<\/td><td class=\"column-3\">Zhenru Pan, Zhilong Ji, Xiao Liu, Jinfeng Bai and Cheng-Lin Liu<\/td>\n<\/tr>\n<tr class=\"row-22 even\">\n\t<td class=\"column-1\">2503<\/td><td class=\"column-2\">SET, SORT! A Novel Sub-Stroke Level Transformer for Offline Handwriting to Online Conversion<\/td><td class=\"column-3\">Elmokhtar Mohamed Moussa, Thibault Lelore and Harold Mouch\u00e8re<\/td>\n<\/tr>\n<tr class=\"row-23 odd\">\n\t<td class=\"column-1\">2969<\/td><td class=\"column-2\">Robustness Evaluation of Transformer-based Form Field Extractors via Form Attacks<\/td><td class=\"column-3\">Le Xue, Mingfei Gao, Zeyuan Chen, Caiming Xiong and Ran Xu<\/td>\n<\/tr>\n<tr class=\"row-24 even\">\n\t<td class=\"column-1\">3025<\/td><td class=\"column-2\">FCN-Boosted Historical Map Segmentation with Little Training Data<\/td><td class=\"column-3\">Josef Baloun, Ladislav Lenc and Pavel Kr\u00e1l<\/td>\n<\/tr>\n<tr class=\"row-25 odd\">\n\t<td class=\"column-1\">3117<\/td><td class=\"column-2\">SCI-3000: A Dataset for Figure, Table and Caption Extraction from Scientific PDFs<\/td><td class=\"column-3\">Filip Darmanovi\u0107, Allan Hanbury and Markus Zlabinger<\/td>\n<\/tr>\n<tr class=\"row-26 even\">\n\t<td class=\"column-1\">3176<\/td><td class=\"column-2\">How to Choose Pretrained Handwriting Recognition Models for Single Writer Fine-Tuning<\/td><td class=\"column-3\">Vittorio Pippi, Silvia Cascianelli, Christopher Kermorvant and Rita Cucchiara<\/td>\n<\/tr>\n<tr class=\"row-27 odd\">\n\t<td class=\"column-1\">3372<\/td><td class=\"column-2\">An End-to-End Local Attention Based Model for Table Recognition<\/td><td class=\"column-3\">Nam Tuan Ly and Atsuhiro Takasu<\/td>\n<\/tr>\n<tr class=\"row-28 even\">\n\t<td class=\"column-1\">3827<\/td><td class=\"column-2\">Diffusion-based document layout generation<\/td><td class=\"column-3\">Liu He, Yijuan Lu, John Corring, Dinei Florencio and Cha Zhang<\/td>\n<\/tr>\n<tr class=\"row-29 odd\">\n\t<td class=\"column-1\">4206<\/td><td class=\"column-2\">Character Queries: A Transformer-based Approach to On-Line Handwritten Character Segmentation<\/td><td class=\"column-3\">Michael Jungo, Beat Wolf, Andrii Maksai, Claudiu Musat and Andreas Fischer<\/td>\n<\/tr>\n<tr class=\"row-30 even\">\n\t<td class=\"column-1\">4261<\/td><td class=\"column-2\">Semantic Graph Representation Learning for Handwritten Mathematical Expression Recognition<\/td><td class=\"column-3\">Zhuang Liu, Ye Yuan, Zhilong Ji, Jinfeng Bai and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-31 odd\">\n\t<td class=\"column-1\">4838<\/td><td class=\"column-2\">TBM-GAN: Synthetic Document Generation with Degraded Background<\/td><td class=\"column-3\">Arnab Poddar, Soumyadeep Dey, Pratik Jawanpuria, Jayanta Mukhopadhyay and Prabir Kumar Biswas<\/td>\n<\/tr>\n<tr class=\"row-32 even\">\n\t<td class=\"column-1\">4995<\/td><td class=\"column-2\">Information Extraction from Documents: Question Answering vs Token Classification in real-world setups<\/td><td class=\"column-3\">Laurent Lam, Pirashanth Ratnamogan, Jo\u00ebl Tang, William Vanhuffel and Fabien Caspani<\/td>\n<\/tr>\n<tr class=\"row-33 odd\">\n\t<td class=\"column-1\">5340<\/td><td class=\"column-2\">A Holistic Approach for Aligned Music and Lyrics Transcription<\/td><td class=\"column-3\">Juan C. Martinez-Sevilla, Antonio Rios-Vila, Francisco J. Castellanos and Jorge Calvo-Zaragoza<\/td>\n<\/tr>\n<tr class=\"row-34 even\">\n\t<td class=\"column-1\">5871<\/td><td class=\"column-2\">The Bullinger Writer Adaptation Challenge<\/td><td class=\"column-3\">Anna Scius-Bertrand and Andreas Fischer<\/td>\n<\/tr>\n<tr class=\"row-35 odd\">\n\t<td class=\"column-1\">5959<\/td><td class=\"column-2\">HisDoc R-CNN: Robust Chinese Historical Document Text Line Detection with Dynamic Rotational Proposal Network and Iterative Attention Head<\/td><td class=\"column-3\">Cheng Jian, Lianwen Jin, Lingyu Liang and Chongyu Liu<\/td>\n<\/tr>\n<tr class=\"row-36 even\">\n\t<td class=\"column-1\">6936<\/td><td class=\"column-2\">Zero-shot Generation of Training Data with Denoising Diffusion Probabilistic Model for Handwritten Chinese Character Recognition<\/td><td class=\"column-3\">Dongnan Gui, Kai Chen, Haisong Ding and Qiang Huo<\/td>\n<\/tr>\n<tr class=\"row-37 odd\">\n\t<td class=\"column-1\">7163<\/td><td class=\"column-2\">Multimodal Scoring Model for Handwritten Chinese Essay<\/td><td class=\"column-3\">Tonghua Su, Jifeng Wang, Hongming You and Zhongjie Wang<\/td>\n<\/tr>\n<tr class=\"row-38 even\">\n\t<td class=\"column-1\">7277<\/td><td class=\"column-2\">Structure Diagram Recognition in Financial Announcements<\/td><td class=\"column-3\">Meixuan Qiao, Jun Wang, Junfu Xiang, Qiyu Hou and Ruixuan Li<\/td>\n<\/tr>\n<tr class=\"row-39 odd\">\n\t<td class=\"column-1\">7655<\/td><td class=\"column-2\">Keyword Spotting Simplified: A Segmentation-Free Approach using Character Counting and CTC re-scoring<\/td><td class=\"column-3\">George Retsinas, Giorgos Sfikas and Christophoros Nikou<\/td>\n<\/tr>\n<tr class=\"row-40 even\">\n\t<td class=\"column-1\">7705<\/td><td class=\"column-2\">Re-thinking Text Clustering for Images with Text<\/td><td class=\"column-3\">Shwet Kamal Mishra, Soham Joshi and Viswanath Gopalakrishnan<\/td>\n<\/tr>\n<tr class=\"row-41 odd\">\n\t<td class=\"column-1\">8247<\/td><td class=\"column-2\">An Encoder-Decoder Method with Position-Aware for Printed Mathematical Expression Recognition<\/td><td class=\"column-3\">Quan Hong, Jun Long and Liu Yang<\/td>\n<\/tr>\n<tr class=\"row-42 even\">\n\t<td class=\"column-1\">8444<\/td><td class=\"column-2\">A multi-level synthesis strategy for online handwritten chemical equation recognition<\/td><td class=\"column-3\">Haoyang Shen, Jinrong Li, Jianmin Lin and Wei Wu<\/td>\n<\/tr>\n<tr class=\"row-43 odd\">\n\t<td class=\"column-1\">8654<\/td><td class=\"column-2\">BaDLAD: A Large Multi-Domain Bengali Document Layout Analysis Dataset<\/td><td class=\"column-3\">Md. Istiak Hossain Shihab, Md. Rakibul Hasan, Mahfuzur Rahman Emon, Syed Mobassir Hossen, Md. Nazmuddoha Ansary, Intesur Ahmed, Fazle Rabbi Rakib, Shahriar Elahi Dhruvo, Souhardya Saha Dip, Akib Hasan Pavel, Marsia Haque Meghla, Md. Rezwanul Haque, Sayma Sultana Chowdhury, Farig Sadeque, Tahsin Reasat, Ahmed Imtiaz Humayun and Asif Shahriyar Sushmit<\/td>\n<\/tr>\n<tr class=\"row-44 even\">\n\t<td class=\"column-1\">8783<\/td><td class=\"column-2\">SwinDocSegmenter: An End-to-End Unified Domain Adaptive Transformer for Document Instance Segmentation<\/td><td class=\"column-3\">Ayan Banerjee, Sanket Biswas, Josep Llad\u00f3s and Umapada Pal<\/td>\n<\/tr>\n<tr class=\"row-45 odd\">\n\t<td class=\"column-1\">9104<\/td><td class=\"column-2\">A Unified Document-level Chinese Discourse Parser on Different Granularity Levels<\/td><td class=\"column-3\">Weihao Liu, Feng Jiang, Yaxin Fan, Xiaomin Chu, Peifeng Li and Qiaoming Zhu<\/td>\n<\/tr>\n<tr class=\"row-46 even\">\n\t<td class=\"column-1\">9420<\/td><td class=\"column-2\">Context Aware Document Binarization and Its Application to Information Extraction from Structured Documents<\/td><td class=\"column-3\">J\u00e1n Koloda and Jue Wang<\/td>\n<\/tr>\n<tr class=\"row-47 odd\">\n\t<td class=\"column-1\">9527<\/td><td class=\"column-2\">Context and Structure Understanding Oriented Chart Object Detection<\/td><td class=\"column-3\">Pengyu Yan, Saleem Ahmed and David Doermann<\/td>\n<\/tr>\n<tr class=\"row-48 even\">\n\t<td class=\"column-1\">9548<\/td><td class=\"column-2\">SelfDocSeg: A self-supervised vision-based approach towards Document Segmentation<\/td><td class=\"column-3\">Subhajit Maity, Sanket Biswas, Siladittya Manna, Ayan Banerjee, Josep Llad\u00f3s, Saumik Bhattacharya and Umapada Pal<\/td>\n<\/tr>\n<tr class=\"row-49 odd\">\n\t<td class=\"column-1\">9623<\/td><td class=\"column-2\">Generalization of Fine Granular Extractions from Charts<\/td><td class=\"column-3\">Shubham Singh Paliwal, Manasi Patwardhan and Lovekesh Vig<\/td>\n<\/tr>\n<tr class=\"row-50 even\">\n\t<td class=\"column-1\">9627<\/td><td class=\"column-2\">A hybrid model for multilingual OCR<\/td><td class=\"column-3\">David Etter, Cameron Carpenter and Nolan King<\/td>\n<\/tr>\n<tr class=\"row-51 odd\">\n\t<td class=\"column-1\">9679<\/td><td class=\"column-2\">Towards Writer Retrieval for Historical Datasets<\/td><td class=\"column-3\">Marco Peer, Florian Kleber and Robert Sablatnig<\/td>\n<\/tr>\n<tr class=\"row-52 even\">\n\t<td class=\"column-1\">9690<\/td><td class=\"column-2\">DTDT: Highly Accurate Dense Text Line Detection in Historical Documents via Dynamic Transformer<\/td><td class=\"column-3\">Haiyang Li, Chongyu Liu, Jiapeng Wang, Mingxin Huang, Weiying Zhou and Lianwen Jin<\/td>\n<\/tr>\n<tr class=\"row-53 odd\">\n\t<td class=\"column-1\">9711<\/td><td class=\"column-2\">DQ-DETR: Dynamic Queries Enhanced Detection Transformer for Arbitrary Shape Text Detection<\/td><td class=\"column-3\">Chixiang Ma, Lei Sun, Jiawei Wang and Qiang Huo<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-oral-papers from cache -->\n\n\n<h4 class=\"wp-block-heading\">Poster Presentations<\/h4>\n\n\n\n<table id=\"tablepress-papers-posters\" class=\"tablepress tablepress-id-papers-posters tablepress-accepted-papers\">\n<tbody>\n<tr class=\"row-1 odd\">\n\t<td class=\"column-1\">125<\/td><td class=\"column-2\">A Shallow Graph Neural Network with Innovative Node Updating for Online Handwritten Stroke Classification<\/td><td class=\"column-3\">Yan-Rong Wang, Da-Han Wang, Xiao-Long Yun, Yan-Ming Zhang, Fei Yin and Shunzhi Zhu<\/td>\n<\/tr>\n<tr class=\"row-2 even\">\n\t<td class=\"column-1\">171<\/td><td class=\"column-2\">Improving Handwritten OCR with Training Samples Generated by Glyph Conditional Denoising Diffusion Probabilistic Model<\/td><td class=\"column-3\">Haisong Ding, Bozhi Luan, Dongnan Gui, Kai Chen and Qiang Huo<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n\t<td class=\"column-1\">200<\/td><td class=\"column-2\">MIDV-Holo: a dataset for ID document hologram detection in a video stream<\/td><td class=\"column-3\">Leisan Koliaskina, Ekaterina Emelianova, Daniil Tropin, Vladimir Popov, Konstantin Bulatov, Dmitry Nikolaev and Vladimir V. Arlazarov<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n\t<td class=\"column-1\">491<\/td><td class=\"column-2\">Aligning benchmark datasets for table structure recognition<\/td><td class=\"column-3\">Brandon Smock, Rohith Pesala and Robin Abraham<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n\t<td class=\"column-1\">590<\/td><td class=\"column-2\">Improved Learning for Online Handwritten Chinese Text Recognition with Convolutional Prototye Network<\/td><td class=\"column-3\">Yi Chen, Heng Zhang and Cheng-Lin Liu<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n\t<td class=\"column-1\">832<\/td><td class=\"column-2\">Vision Conformer: Incorporating Convolutions into Vision Transformer Layers<\/td><td class=\"column-3\">Brian Kenji Iwana and Akihiro Kusuda<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n\t<td class=\"column-1\">864<\/td><td class=\"column-2\">Transductive Learning for Near-Duplicate Image Detection in Scanned Photo Collections<\/td><td class=\"column-3\">Francesc Net, Marc Folia, Pep Casals-Puig, and Lluis Gomez<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n\t<td class=\"column-1\">1118<\/td><td class=\"column-2\">Modeling Cross-layer Interaction for Chinese Calligraphy Style Classification<\/td><td class=\"column-3\">Zhigang Li, Li Liu, Taorong Qiu, Yue Lu and Ching Y. Suen<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n\t<td class=\"column-1\">1120<\/td><td class=\"column-2\">Evaluation of different tagging schemes for Named Entity Recognition in Handwritten Documents<\/td><td class=\"column-3\">David Villanova-Aparisi, Carlos David Martinez-Hinarejos, Ver\u00f3nica Romero and Mois\u00e9s Pastor-Gadea<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n\t<td class=\"column-1\">1419<\/td><td class=\"column-2\">Analyzing the Impact of Tokenization on Multilingual Epidemic Surveillance in Low-resource Languages<\/td><td class=\"column-3\">Stephen Mutuvi, Emanuela Boros, Antoine Doucet, Adam Jatowt, Ga\u00ebl Lejeune and Moses Odeo<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n\t<td class=\"column-1\">1429<\/td><td class=\"column-2\">Text Reading Order in Uncontrolled Conditions by Sparse Graph Segmentation<\/td><td class=\"column-3\">Renshen Wang, Yasuhisa Fujii and Alessandro Bissacco<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n\t<td class=\"column-1\">1442<\/td><td class=\"column-2\">Exploring Semantic Word Representations for Recognition-free NLP on Handwritten Document Images<\/td><td class=\"column-3\">Oliver T\u00fcselmann and Gernot A. Fink<\/td>\n<\/tr>\n<tr class=\"row-13 odd\">\n\t<td class=\"column-1\">1633<\/td><td class=\"column-2\">DAMGCN: Entity Linking in Visually Rich Documents with Dependency-Aware Multimodal Graph Convolutional Network<\/td><td class=\"column-3\">Yi-Ming Chen, Xiang-Ting Hou, Dong-Fang Lou, Zhi-Lin Liao and Cheng-Lin Liu<\/td>\n<\/tr>\n<tr class=\"row-14 even\">\n\t<td class=\"column-1\">1827<\/td><td class=\"column-2\">TDAE: Text Detection with Affinity Areas and Evolution Strategies<\/td><td class=\"column-3\">Kefan Ma, Yuchen Luo, Zheng Huang, Kai Chen, Jie Guo and Weidong Qiu<\/td>\n<\/tr>\n<tr class=\"row-15 odd\">\n\t<td class=\"column-1\">1887<\/td><td class=\"column-2\">OCR Language Models with Custom Vocabularies<\/td><td class=\"column-3\">Peter Garst, Yasuhisa Fuji and Reeve Ingle<\/td>\n<\/tr>\n<tr class=\"row-16 even\">\n\t<td class=\"column-1\">1934<\/td><td class=\"column-2\">Incremental Learning and Ambiguity Rejection for Document Classification<\/td><td class=\"column-3\">Tri-Cong Pham, Micka\u00ebl Coustaty, Aur\u00e9lie Joseph, Vincent Poulain D&#8217;Andecy, Muriel Visani and Nicolas Sidere<\/td>\n<\/tr>\n<tr class=\"row-17 odd\">\n\t<td class=\"column-1\">2013<\/td><td class=\"column-2\">LineFormer: Line Chart Data Extraction using Instance Segmentation<\/td><td class=\"column-3\">Jay Lal, Aditya Mitkari, Mahesh Bhosale and David Doermann<\/td>\n<\/tr>\n<tr class=\"row-18 even\">\n\t<td class=\"column-1\">2095<\/td><td class=\"column-2\">A Unified Architecture for Urdu Printed and Handwritten Text Recognition<\/td><td class=\"column-3\">Arooba Maqsood, Nauman Riaz, Adnan Ul-Hasan and Faisal Shafait<\/td>\n<\/tr>\n<tr class=\"row-19 odd\">\n\t<td class=\"column-1\">2100<\/td><td class=\"column-2\">Analysing Textual Information from Financial Statements for Default Prediction<\/td><td class=\"column-3\">Chinesh Doshi, Himani Shrotriya, Rohit Bhiogade, Himanshu Sharad Bhatt and Abhishek Jha<\/td>\n<\/tr>\n<tr class=\"row-20 even\">\n\t<td class=\"column-1\">2111<\/td><td class=\"column-2\">Visual Information Extraction in the Wild: Practical Dataset and End-to-end Solution<\/td><td class=\"column-3\">Jianfeng Kuang, Wei Hua, Dingkang Liang, Mingkun Yang, Deqiang Jiang, Bo Ren and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-21 odd\">\n\t<td class=\"column-1\">2121<\/td><td class=\"column-2\">Line-of-sight with Graph Attention Parser (LGAP) for Math Formulas<\/td><td class=\"column-3\">Ayush Kumar Shah and Richard Zanibbi<\/td>\n<\/tr>\n<tr class=\"row-22 even\">\n\t<td class=\"column-1\">2194<\/td><td class=\"column-2\">EEBO-Verse: Sifting for Poetry in Large Early Modern Corpora using Visual Features<\/td><td class=\"column-3\">Danlu Chen, Nan Jiang and Taylor Berg-Kirkpatrick<\/td>\n<\/tr>\n<tr class=\"row-23 odd\">\n\t<td class=\"column-1\">2309<\/td><td class=\"column-2\">A Graphical Approach to Document Layout Analysis<\/td><td class=\"column-3\">Jilin Wang, Michael Krumdick, Baojia Tong, Delphine Vendryes, Hamima Halim, Maxim Sokolov, Vadym Barda and Chris Tanner<\/td>\n<\/tr>\n<tr class=\"row-24 even\">\n\t<td class=\"column-1\">2311<\/td><td class=\"column-2\">Scene Text Recognition with Image-Text Matching-guided Dictionary<\/td><td class=\"column-3\">Jiajun Wei, Hongjian Zhan, Xiao Tu, Yue Lu and Umapada Pal<\/td>\n<\/tr>\n<tr class=\"row-25 odd\">\n\t<td class=\"column-1\">2566<\/td><td class=\"column-2\">PyramidTabNet: Transformer based Table Recognition in Image-based Documents<\/td><td class=\"column-3\">Muhammad Umer, Ahmed Mohsin, Adnan Ul-Hasan and Faisal Shafait<\/td>\n<\/tr>\n<tr class=\"row-26 even\">\n\t<td class=\"column-1\">2627<\/td><td class=\"column-2\">Gaussian Kernels based Network for Multiple License Plate Number Detection in Day-Night Images<\/td><td class=\"column-3\">Soumi Das, Shivakumara Palaiahnakote, Umapada Pal and Raghavendra Ramachandra<\/td>\n<\/tr>\n<tr class=\"row-27 odd\">\n\t<td class=\"column-1\">2678<\/td><td class=\"column-2\">Ensuring an error-free transcription on a full engineering tags dataset  through unsupervised Post-OCR methods<\/td><td class=\"column-3\">Mathieu Francois and V\u00e9ronique Eglin<\/td>\n<\/tr>\n<tr class=\"row-28 even\">\n\t<td class=\"column-1\">2745<\/td><td class=\"column-2\">Sampling and Ranking for Digital Ink Generation on a tight computational budget<\/td><td class=\"column-3\">Andrii Maksai, Andrei Afonin, Aleksandr Timofeev and Claudiu Musat<\/td>\n<\/tr>\n<tr class=\"row-29 odd\">\n\t<td class=\"column-1\">2771<\/td><td class=\"column-2\">Unraveling confidence: examining confidence scores as proxy for OCR quality<\/td><td class=\"column-3\">Mirjam Cuper, Corine van Dongen and Tineke Koster<\/td>\n<\/tr>\n<tr class=\"row-30 even\">\n\t<td class=\"column-1\">2850<\/td><td class=\"column-2\">E2TIMT: Efficient and Effective Modal Adapter for Text Image Machine Translation<\/td><td class=\"column-3\">Cong Ma, Yaping Zhang, Mei Tu, Yang Zhao, Yu Zhou and Chengqing Zong<\/td>\n<\/tr>\n<tr class=\"row-31 odd\">\n\t<td class=\"column-1\">3015<\/td><td class=\"column-2\">RealCQA: Scientific Chart Question Answering as a Test-bed for First-Order Logic<\/td><td class=\"column-3\">Saleem Ahmed, Bhavin Jawade, Shubham Pandey, Srirangaraj Setlur and Venu Govindaraju<\/td>\n<\/tr>\n<tr class=\"row-32 even\">\n\t<td class=\"column-1\">3165<\/td><td class=\"column-2\">An Iterative Graph Learning Convolution Network for Key Information Extraction Based on the Document Inductive Bias<\/td><td class=\"column-3\">Jiyao Deng, Yi Zhang, Xinpeng Zhang, Zhi Tang and Liangcai Gao<\/td>\n<\/tr>\n<tr class=\"row-33 odd\">\n\t<td class=\"column-1\">3232<\/td><td class=\"column-2\">Open-Set Text Recognition via Shape-Awareness Visual Reconstruction<\/td><td class=\"column-3\">Chang Liu, Chun Yang and Xu-Cheng Yin<\/td>\n<\/tr>\n<tr class=\"row-34 even\">\n\t<td class=\"column-1\">3409<\/td><td class=\"column-2\">Accelerating Transformer-Based Scene Text Detection and Recognition via Token Pruning<\/td><td class=\"column-3\">Sergi Garcia-Bordils, Dimosthenis Karatzas and Mar\u00e7al Rusi\u00f1ol<\/td>\n<\/tr>\n<tr class=\"row-35 odd\">\n\t<td class=\"column-1\">3475<\/td><td class=\"column-2\">Optimizing the Performance of Text Classification Models by Improving the Isotropy of the Embeddings using a Joint Loss Function<\/td><td class=\"column-3\">Joseph Attieh, Abraham Woubie Zewoudie, Vladimir Vlassov, Adrian Flanagan and Tom B\u00e4ckstr\u00f6m<\/td>\n<\/tr>\n<tr class=\"row-36 even\">\n\t<td class=\"column-1\">3789<\/td><td class=\"column-2\">Linguistic Knowledge within Handwritten Text Recognition Models: A Real-World Case Study<\/td><td class=\"column-3\">Samuel Londner, Yoav Phillips, Hadar Miller, Nachum Dershowitz, Tsvi Kuflik and Moshe Lavee<\/td>\n<\/tr>\n<tr class=\"row-37 odd\">\n\t<td class=\"column-1\">3792<\/td><td class=\"column-2\">FTDNet: Joint Semantic Learning for Scene Text Detection in Adverse Weather Conditions<\/td><td class=\"column-3\">Jiakun Tian, Gang Zhou, Yangxin Liu, En Deng and Zhenhong Jia<\/td>\n<\/tr>\n<tr class=\"row-38 even\">\n\t<td class=\"column-1\">3833<\/td><td class=\"column-2\">DocParser: end-to-end OCR-free information extraction from Visually Rich Documents<\/td><td class=\"column-3\">Mohamed Dhouib, Ghassen Bettaieb and Aymen Shabou<\/td>\n<\/tr>\n<tr class=\"row-39 odd\">\n\t<td class=\"column-1\">3928<\/td><td class=\"column-2\">Ambigram Generation by A Diffusion Model<\/td><td class=\"column-3\">Takahiro Shirakawa and Seiichi Uchida<\/td>\n<\/tr>\n<tr class=\"row-40 even\">\n\t<td class=\"column-1\">4033<\/td><td class=\"column-2\">Decoupled Learning for Long-Tailed Oracle Character Recognition<\/td><td class=\"column-3\">Jing Li, Bin Dong, Qiu-Feng Wang, Lei Ding, Rui Zhang and Kaizhu Huang<\/td>\n<\/tr>\n<tr class=\"row-41 odd\">\n\t<td class=\"column-1\">4066<\/td><td class=\"column-2\">Analyzing Font Style Usage and Contextual Factors in Real Images<\/td><td class=\"column-3\">Naoya Yasukochi, Hideaki Hayashi, Daichi Haraguchi and Seiichi Uchida<\/td>\n<\/tr>\n<tr class=\"row-42 even\">\n\t<td class=\"column-1\">4083<\/td><td class=\"column-2\">Faster DAN: Multi-target Queries with Document Positional Encoding for End-to-end Handwritten Document Recognition<\/td><td class=\"column-3\">Denis Coquenet, Cl\u00e9ment Chatelain and Thierry Paquet<\/td>\n<\/tr>\n<tr class=\"row-43 odd\">\n\t<td class=\"column-1\">4131<\/td><td class=\"column-2\">QuOTeS: Query-Oriented Technical Summarization<\/td><td class=\"column-3\">Juan Antonio Ramirez-Orta, Eduardo Xamena, Ana Maguitman, Axel J. Soto, Flavia P. Zanoto and Evangelos Milios<\/td>\n<\/tr>\n<tr class=\"row-44 even\">\n\t<td class=\"column-1\">4178<\/td><td class=\"column-2\">MUGS: A Multiple Granularity Semi-Supervised Method for Text Recognition<\/td><td class=\"column-3\">Qi Song, Qianyi Jiang, Wang Lei, Lingling Zhao and Rui Zhang<\/td>\n<\/tr>\n<tr class=\"row-45 odd\">\n\t<td class=\"column-1\">4204<\/td><td class=\"column-2\">Text Enhancement\uff1aScene Text Recognition in Hazy Weather<\/td><td class=\"column-3\">En Deng, Gang Zhou, Jiakun Tian, Yangxin Liu and Zhenhong Jia<\/td>\n<\/tr>\n<tr class=\"row-46 even\">\n\t<td class=\"column-1\">4287<\/td><td class=\"column-2\">Shared-Operation Hypercomplex Networks for Handwritten Text Recognition<\/td><td class=\"column-3\">Giorgos Sfikas, George Retsinas, Panagiotis Dimitrakopoulos, Basilis Gatos and Christophoros Nikou<\/td>\n<\/tr>\n<tr class=\"row-47 odd\">\n\t<td class=\"column-1\">4289<\/td><td class=\"column-2\">A Hybrid Approach to Document Layout Analysis for Heterogeneous Document Images<\/td><td class=\"column-3\">Zhuoyao Zhong, Jiawei Wang, Haiqing Sun, Kai Hu, Erhan Zhang, Lei Sun and Qiang Huo<\/td>\n<\/tr>\n<tr class=\"row-48 even\">\n\t<td class=\"column-1\">4319<\/td><td class=\"column-2\">ColDBin: Cold Diffusion for Document Image Binarization<\/td><td class=\"column-3\">Saifullah Saifullah, Stefan Agne, Andreas Dengel and Sheraz Ahmed<\/td>\n<\/tr>\n<tr class=\"row-49 odd\">\n\t<td class=\"column-1\">4485<\/td><td class=\"column-2\">You Only Look for a Symbol Once: An Object Detector for Symbols and Regions in Documents<\/td><td class=\"column-3\">William Smith and Toby Pillatt<\/td>\n<\/tr>\n<tr class=\"row-50 even\">\n\t<td class=\"column-1\">4548<\/td><td class=\"column-2\">SAN: Structure-Aware Network for Complex and Long-tailed Chinese Text Recognition<\/td><td class=\"column-3\">Junyi Zhang, Chang Liu and Chun Yang<\/td>\n<\/tr>\n<tr class=\"row-51 odd\">\n\t<td class=\"column-1\">4601<\/td><td class=\"column-2\">DSS: Synthesizing long Digital Ink using Data augmentation, Style encoding and Split generation.<\/td><td class=\"column-3\">Aleksandr Timofeev, Anastasiia Fadeeva, Andrii Maksai, Claudiu Musat and Andrei Afonin<\/td>\n<\/tr>\n<tr class=\"row-52 even\">\n\t<td class=\"column-1\">4804<\/td><td class=\"column-2\">A Benchmark of Nested Named Entity Recognition Approaches in Historical Structured Documents<\/td><td class=\"column-3\">Solenn Tual, Nathalie Abadie, Bertrand Dum\u00e9nieu, Joseph Chazalon and Edwin Carlinet<\/td>\n<\/tr>\n<tr class=\"row-53 odd\">\n\t<td class=\"column-1\">5000<\/td><td class=\"column-2\">Reading Between the Lanes: Text VideoQA on the Road<\/td><td class=\"column-3\">George Tom, Minesh Mathew, Sergi Garcia, Dimosthenis Karatzas and C.V. Jawahar<\/td>\n<\/tr>\n<tr class=\"row-54 even\">\n\t<td class=\"column-1\">5003<\/td><td class=\"column-2\">Line Graphics Digitization: A Step Towards Full Automation<\/td><td class=\"column-3\">Omar Moured, Jiaming Zhang, Alina Roitberg, Thorsten Schwarz and Rainer Stiefelhagen<\/td>\n<\/tr>\n<tr class=\"row-55 odd\">\n\t<td class=\"column-1\">5017<\/td><td class=\"column-2\">TACTFUL: A framework for Targeted Active Learning for Document Analysis<\/td><td class=\"column-3\">Venkatapathy Subramanian, Sagar Poudel, Ganesh Ramakrishnan and Parag Chaudhuri<\/td>\n<\/tr>\n<tr class=\"row-56 even\">\n\t<td class=\"column-1\">5117<\/td><td class=\"column-2\">&#8220;Explain Thyself Bully&#8221;: Sentiment Aided Cyberbullying Detection with Explanation<\/td><td class=\"column-3\">Krishanu Maity, Prince Jha, Raghav Jain, Sriparna Saha and Pushpak Bhattacharyya<\/td>\n<\/tr>\n<tr class=\"row-57 odd\">\n\t<td class=\"column-1\">5155<\/td><td class=\"column-2\">CCpdf: Building a High Quality Corpus for Visually Rich Documents from Web Crawl Data<\/td><td class=\"column-3\">Micha\u0142 Turski, Tomasz Stanis\u0142awek, Karol Kaczmarek, Pawe\u0142 Dyda and Filip Grali\u0144ski<\/td>\n<\/tr>\n<tr class=\"row-58 even\">\n\t<td class=\"column-1\">5441<\/td><td class=\"column-2\">LayoutGCN: A Lightweight Architecture for Visually Rich Document Understanding<\/td><td class=\"column-3\">Dengliang Shi, Siliang Liu, Jintao Du and Huijia Zhu<\/td>\n<\/tr>\n<tr class=\"row-59 odd\">\n\t<td class=\"column-1\">5525<\/td><td class=\"column-2\">TPFNet: A Novel Text In-painting Transformer for Text Removal<\/td><td class=\"column-3\">Onkar Susladkar, Dhruv Makwana, Gayatri Deshmukh, Sparsh Mittal, R Sai Chandra Teja and Rekha Singhal<\/td>\n<\/tr>\n<tr class=\"row-60 even\">\n\t<td class=\"column-1\">5671<\/td><td class=\"column-2\">Linear Object Detection in Document Images using Multiple Object Tracking<\/td><td class=\"column-3\">Philippe Bernet, Joseph Chazalon, Edwin Carlinet, Alexandre Bourquelot and Elodie Puybareau<\/td>\n<\/tr>\n<tr class=\"row-61 odd\">\n\t<td class=\"column-1\">5935<\/td><td class=\"column-2\">ESTER-Pt: An Evaluation Suite for TExt Recognition in Portuguese<\/td><td class=\"column-3\">Moniele Kunrath Santos, Guilherme Bazzo, Lucas Lima de Oliveira and Viviane P. Moreira<\/td>\n<\/tr>\n<tr class=\"row-62 even\">\n\t<td class=\"column-1\">5939<\/td><td class=\"column-2\">Topic Shift Detection in Chinese Dialogues: Corpus and Benchmark<\/td><td class=\"column-3\">Jiangyi Lin, Yaxin Fan, Feng Jiang, Xiaomin Chu and Peifeng Li<\/td>\n<\/tr>\n<tr class=\"row-63 odd\">\n\t<td class=\"column-1\">5951<\/td><td class=\"column-2\">End-to-end Multi-line License Plate Recognition with Cascaded Perception<\/td><td class=\"column-3\">Song-Lu Chen, Qi Liu, Feng Chen and Xu-Cheng Yin<\/td>\n<\/tr>\n<tr class=\"row-64 even\">\n\t<td class=\"column-1\">6036<\/td><td class=\"column-2\">Precise Segmentation for Children Handwriting Analysis by Combining Multiple Deep Models with Online Knowledge<\/td><td class=\"column-3\">Simon Corbill\u00e9, \u00c9ric Anquetil and \u00c9lisa Fromont<\/td>\n<\/tr>\n<tr class=\"row-65 odd\">\n\t<td class=\"column-1\">6077<\/td><td class=\"column-2\">Augraphy: A Data Augmentation Library for Document Images<\/td><td class=\"column-3\">Alexander Groleau, Kok Wei Chee, Stefan Larson, Samay Maini and Jonathan Boarman<\/td>\n<\/tr>\n<tr class=\"row-66 even\">\n\t<td class=\"column-1\">6359<\/td><td class=\"column-2\">TRACE:Table Reconstruction Aligned to Corner and Edges<\/td><td class=\"column-3\">Youngmin Baek, Daehyun Nam, Jaeheung Surh, Seung Shin and Seonghyeon Kim<\/td>\n<\/tr>\n<tr class=\"row-67 odd\">\n\t<td class=\"column-1\">6471<\/td><td class=\"column-2\">Fine-tuning Vision Encoder-Decoder Transformers for Handwriting Text Recognition on Historical Documents<\/td><td class=\"column-3\">Daniel Parres Montoya and Roberto Paredes Palacios<\/td>\n<\/tr>\n<tr class=\"row-68 even\">\n\t<td class=\"column-1\">6475<\/td><td class=\"column-2\">Detecting Forged Receipts with Domain-specific Ontology-based Entities &amp; Relations<\/td><td class=\"column-3\">Beatriz Mart\u00ednez Torn\u00e9s, Emanuela Boros, Petra Gomez-Kr\u00e4mer, Antoine Doucet and Jean-Marc Ogier<\/td>\n<\/tr>\n<tr class=\"row-69 odd\">\n\t<td class=\"column-1\">6512<\/td><td class=\"column-2\">Evaluating Adversarial Robustness on Document Image Classification<\/td><td class=\"column-3\">Timoth\u00e9e Fronteau, Arnaud Paran and Aymen Shabou<\/td>\n<\/tr>\n<tr class=\"row-70 even\">\n\t<td class=\"column-1\">6516<\/td><td class=\"column-2\">UTRNet: High-Resolution Urdu Text Recognition In Printed Documents<\/td><td class=\"column-3\">Abdur Rahman, Chetan Arora and Arjun Ghosh<\/td>\n<\/tr>\n<tr class=\"row-71 odd\">\n\t<td class=\"column-1\">6754<\/td><td class=\"column-2\">Contour Completion by Transformers and Its Application to Vector Font Data<\/td><td class=\"column-3\">Yusuke Nagata, Brian Kenji Iwana and Seiichi Uchida<\/td>\n<\/tr>\n<tr class=\"row-72 even\">\n\t<td class=\"column-1\">6780<\/td><td class=\"column-2\">CED: Catalog Extraction from Documents<\/td><td class=\"column-3\">Tong Zhu, Guoliang Zhang, Zechang Li, Zijian Yu, Junfei Ren, Mengsong Wu, Zhefeng Wang, Baoxing Huai, Pingfu Chao and Wenliang Chen<\/td>\n<\/tr>\n<tr class=\"row-73 odd\">\n\t<td class=\"column-1\">7047<\/td><td class=\"column-2\">TextREC: a Dataset for Referring Expression Comprehension with Reading Comprehension<\/td><td class=\"column-3\">Chenyang Gao, Biao Yang, Hao Wang, Mingkun Yang, Wenwen Yu, Yuliang Liu and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-74 even\">\n\t<td class=\"column-1\">7080<\/td><td class=\"column-2\">Layout Analysis of Historical Document Images using a Light Fully Convolutional Networks<\/td><td class=\"column-3\">Najoua Rahal, Lars V\u00f6gtlin and Rolf Ingold<\/td>\n<\/tr>\n<tr class=\"row-75 odd\">\n\t<td class=\"column-1\">7131<\/td><td class=\"column-2\">A Character-level Document Key Information Extraction Method with Contrastive Learning<\/td><td class=\"column-3\">Xinpeng Zhang, Liangcai Gao and Jiyao Deng<\/td>\n<\/tr>\n<tr class=\"row-76 even\">\n\t<td class=\"column-1\">7310<\/td><td class=\"column-2\">Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition<\/td><td class=\"column-3\">Jan Koh\u00fat and Michal Hradi\u0161<\/td>\n<\/tr>\n<tr class=\"row-77 odd\">\n\t<td class=\"column-1\">7319<\/td><td class=\"column-2\">Combining OCR Models for Reading Early Modern Books<\/td><td class=\"column-3\">Mathias Seuret, Janne van der Loop, Nikolaus Weichselbaumer, Martin Mayr, Janina Molnar, Tatjana Hass and Vincent Christlein<\/td>\n<\/tr>\n<tr class=\"row-78 even\">\n\t<td class=\"column-1\">7403<\/td><td class=\"column-2\">Incremental Teacher Model with Mixed Augmentations and Scheduled Pseudo-Label Loss for Handwritten Text Recognition<\/td><td class=\"column-3\">Masayuki Honda, Hung Tuan Nguyen, Cuong Tuan Nguyen, Cong Kha Nguyen, Ryosuke Odate, Takashi Kanemaru and Masaki Nakagawa<\/td>\n<\/tr>\n<tr class=\"row-79 odd\">\n\t<td class=\"column-1\">7663<\/td><td class=\"column-2\">AFFGANwriting: A handwriting image generation method based on multi-feature fusion<\/td><td class=\"column-3\">Heng Wang, Yiming Wang and Hongxi Wei<\/td>\n<\/tr>\n<tr class=\"row-80 even\">\n\t<td class=\"column-1\">7707<\/td><td class=\"column-2\">Towards Making Flowchart Images Machine Interpretable<\/td><td class=\"column-3\">Shreya Shukla, Prajwal Gatti, Yogesh Kumar, Vikash Yadav and Anand Mishra<\/td>\n<\/tr>\n<tr class=\"row-81 odd\">\n\t<td class=\"column-1\">7741<\/td><td class=\"column-2\">SeamFormer: High Precision Text Line Segmentation for Handwritten Documents<\/td><td class=\"column-3\">Niharika Vadlamudi, Rahul Krishna and Ravi Kiran Sarvadevabhatla<\/td>\n<\/tr>\n<tr class=\"row-82 even\">\n\t<td class=\"column-1\">7774<\/td><td class=\"column-2\">SIMARA: a database for key-value information extraction from full-page handwritten documents<\/td><td class=\"column-3\">Sol\u00e8ne Tarride, M\u00e9lodie Boillet, Jean-Fran\u00e7ois Moufflet and Christopher Kermorvant<\/td>\n<\/tr>\n<tr class=\"row-83 odd\">\n\t<td class=\"column-1\">7991<\/td><td class=\"column-2\">On Web-based Visual Corpus Construction for Visual Document Understanding<\/td><td class=\"column-3\">DongHyun Kim, Teakgyu Hong, Moonbin Yim, Yoonsik Kim and Geewook Kim<\/td>\n<\/tr>\n<tr class=\"row-84 even\">\n\t<td class=\"column-1\">8156<\/td><td class=\"column-2\">SegCTC: Offline Handwritten Chinese Text Recognition via Better Fusion between Explicit and Implicit Segmentation<\/td><td class=\"column-3\">Jiarong Huang, Dezhi Peng, Hongliang Li, Hao Ni and Lianwen Jin<\/td>\n<\/tr>\n<tr class=\"row-85 odd\">\n\t<td class=\"column-1\">8519<\/td><td class=\"column-2\">DocImagen: Diffusion Model for Layout Conditioned Document Image Generation<\/td><td class=\"column-3\">Noman Tanveer, Adnan Ul-Hasan and Faisal Shafait<\/td>\n<\/tr>\n<tr class=\"row-86 even\">\n\t<td class=\"column-1\">8595<\/td><td class=\"column-2\">Detecting Text on Historical Maps by Selecting Best Candidates of Deep Neural Networks Output<\/td><td class=\"column-3\">Gerasimos Matidis, Basilis Gatos, Anastasios Kesidis and Panagiotis Kaddas<\/td>\n<\/tr>\n<tr class=\"row-87 odd\">\n\t<td class=\"column-1\">8630<\/td><td class=\"column-2\">Adversarial Attacks on Convolutional Siamese Signature Verification Networks<\/td><td class=\"column-3\">Maham Jahangir, Muhammad Imran Malik and Faisal Shafait<\/td>\n<\/tr>\n<tr class=\"row-88 even\">\n\t<td class=\"column-1\">8652<\/td><td class=\"column-2\">EnsExam: A Dataset for Handwritten Text Erasure on Examination Papers<\/td><td class=\"column-3\">Liufeng Huang, Bangdong Chen, Chongyu Liu, Dezhi Peng, Weiying Zhou, Yaqiang Wu, Hui Li, Hao Ni and Lianwen Jin<\/td>\n<\/tr>\n<tr class=\"row-89 odd\">\n\t<td class=\"column-1\">8727<\/td><td class=\"column-2\">A System for Processing and Recognition of Greek Byzantine and Post-Byzantine Documents<\/td><td class=\"column-3\">Panagiotis Kaddas, Konstantinos Palaiologos, Basilis Gatos, Vassilis Katsouros and Katerina Christopoulou<\/td>\n<\/tr>\n<tr class=\"row-90 even\">\n\t<td class=\"column-1\">8939<\/td><td class=\"column-2\">Multimodal Rumour Detection: Catching news that never transpired!<\/td><td class=\"column-3\">Raghvendra Kumar, Ritika Sinha, Sriparna Saha and Adam Jatowt<\/td>\n<\/tr>\n<tr class=\"row-91 odd\">\n\t<td class=\"column-1\">9048<\/td><td class=\"column-2\">Towards Writing Style Adaptation in Handwriting Recognition<\/td><td class=\"column-3\">Jan Koh\u00fat, Michal Hradi\u0161 and Martin Ki\u0161\u0161<\/td>\n<\/tr>\n<tr class=\"row-92 even\">\n\t<td class=\"column-1\">9308<\/td><td class=\"column-2\">Formerge: Recover spanning cells in complex table structure using transformer network<\/td><td class=\"column-3\">Nam Quan Nguyen, Anh Duy Le, Anh Khoa Lu, Xuan Toan Mai and Tuan Anh Tran<\/td>\n<\/tr>\n<tr class=\"row-93 odd\">\n\t<td class=\"column-1\">9362<\/td><td class=\"column-2\">GriTS: Grid table similarity metric for table structure recognition<\/td><td class=\"column-3\">Brandon Smock, Rohith Pesala and Robin Abraham<\/td>\n<\/tr>\n<tr class=\"row-94 even\">\n\t<td class=\"column-1\">9403<\/td><td class=\"column-2\">Semantic triple-assisted learning for question answering passage re-ranking<\/td><td class=\"column-3\">Dinesh Nagumothu, Bahadorreza Ofoghi and Peter Eklund<\/td>\n<\/tr>\n<tr class=\"row-95 odd\">\n\t<td class=\"column-1\">9559<\/td><td class=\"column-2\">I-WAS: a Data Augmentation Method with GPT-2 for Simile Detection<\/td><td class=\"column-3\">Yongzhu Chang, Rongsheng Zhang and Jiashu Pu<\/td>\n<\/tr>\n<tr class=\"row-96 even\">\n\t<td class=\"column-1\">9669<\/td><td class=\"column-2\">Historical document image segmentation combining deep learning and Gabor features<\/td><td class=\"column-3\">Maroua Mehri, Akrem Sellami and Salvatore Tabbone<\/td>\n<\/tr>\n<tr class=\"row-97 odd\">\n\t<td class=\"column-1\">9806<\/td><td class=\"column-2\">Group, Contrast and Recognize: A Self-supervised Method for Chinese Character Recognition<\/td><td class=\"column-3\">Xinzhe Jiang, Jun Du, Pengfei Hu, Mobai Xue, Jiefeng Ma, Jiajia Wu and Jianshu Zhang<\/td>\n<\/tr>\n<tr class=\"row-98 even\">\n\t<td class=\"column-1\">9867<\/td><td class=\"column-2\">Receipt Dataset for Document Forgery Detection<\/td><td class=\"column-3\">Beatriz Mart\u00ednez Torn\u00e9s, Th\u00e9o Taburet, Emanuela Boros, Kais Rouis, Petra Gomez-Kr\u00e4mer, Nicolas Sidere, Antoine Doucet and Vincent Poulain d&#8217;Andecy<\/td>\n<\/tr>\n<tr class=\"row-99 odd\">\n\t<td class=\"column-1\">9897<\/td><td class=\"column-2\">Content-Aware Urdu Handwriting Generation<\/td><td class=\"column-3\">Zeeshan Memon, Adnan Ul-Hasan and Faisal Shafait<\/td>\n<\/tr>\n<tr class=\"row-100 even\">\n\t<td class=\"column-1\">9904<\/td><td class=\"column-2\">Weakly supervised information extraction from inscrutable handwritten document images<\/td><td class=\"column-3\">Sujoy Paul, Gagan Madan, Akankshya Mishra, Narayan Hegde, Pradeep Kumar and Gaurav Aggarwal<\/td>\n<\/tr>\n<tr class=\"row-101 odd\">\n\t<td class=\"column-1\">9981<\/td><td class=\"column-2\">Information Redundancy and Biases in Public Document Information Extraction Benchmarks<\/td><td class=\"column-3\">Seif Edinne Laatiri, Pirashanth Ratnamogan, Jo\u00ebl Tang, Laurent Lam, William Vanhuffel and Fabien Caspani<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-papers-posters from cache -->\n\n\n<h4 class=\"wp-block-heading\">Competitions<\/h4>\n\n\n\n<table id=\"tablepress-papers-competitions\" class=\"tablepress tablepress-id-papers-competitions tablepress-accepted-papers\">\n<tbody>\n<tr class=\"row-1 odd\">\n\t<td class=\"column-1\">inv-2<\/td><td class=\"column-2\">ICDAR 2023 Competition on Video Text Reading for Dense and Small Text<\/td><td class=\"column-3\">Weijia Wu, Yuzhong Zhao, Zhuang Li, Jiahong Li, Mike Zheng Shou, Umapada Pal, Dimosthenis Karatzas and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-2 even\">\n\t<td class=\"column-1\">inv-4<\/td><td class=\"column-2\">ICDAR 2023 Competition on Document UnderstanDing of Everything (DUDE)<\/td><td class=\"column-3\">Jordy Van Landeghem, Rub\u00e8n Tito, \u0141ukasz Borchmann, Micha\u0142 Pietruszka, Dawid Jurkiewicz, Rafa\u0142 Powalski, Pawe\u0142 J\u00f3ziak, Sanket Biswas, Micka\u00ebl Coustaty and Tomasz Stanis\u0142awek<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n\t<td class=\"column-1\">inv-5<\/td><td class=\"column-2\">ICDAR 2023 Competition on Indic Handwriting Text Recognition<\/td><td class=\"column-3\">Ajoy Mondal and C. V. Jawahar<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n\t<td class=\"column-1\">inv-6<\/td><td class=\"column-2\">ICDAR 2023 Competition on Visual Question Answering on Business Document Images<\/td><td class=\"column-3\">Sachin Raja, Ajoy Mondal and C. V. Jawahar<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n\t<td class=\"column-1\">inv-7<\/td><td class=\"column-2\">ICDAR 2023 Competition on Robust Layout Segmentation in Corporate Documents<\/td><td class=\"column-3\">Christoph Auer, Ahmed Nassar, Maksym Lysak, Michele Dolfi, Nikolaos Livathinos and Peter Staar<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n\t<td class=\"column-1\">inv-8<\/td><td class=\"column-2\">ICDAR 2023 Competition on Hierarchical Text Detection and Recognition<\/td><td class=\"column-3\">Shangbang Long, Siyang Qin, Dmitry Panteleev, Alessandro Bissacco, Yasuhisa Fujii and Michalis Raptis<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n\t<td class=\"column-1\">inv-9<\/td><td class=\"column-2\">ICDAR 2023 Competition on Detection and Recognition of Greek Letters on Papyri<\/td><td class=\"column-3\">Mathias Seuret, Isabelle Marthot-Santaniello, Stephen A. White, Olga Serbaeva Saraogi, Selaudin Agolli, Guillaume Carri\u00e8re, Dalia Rodriguez-Salas and Vincent Christlein<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n\t<td class=\"column-1\">inv-10<\/td><td class=\"column-2\">ICDAR 2023 Competition on Born Digital Video Text Question Answering<\/td><td class=\"column-3\">Zhibo Yang, Xiaoge Song, Sibo Song, Tong Lu, Xiang Bai, Cheng-Lin Liu, Fei Huang and Cong Yao<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n\t<td class=\"column-1\">inv-11<\/td><td class=\"column-2\">ICDAR 2023 Competition on Reading the Seal Title<\/td><td class=\"column-3\">Wenwen Yu, Mingyu Liu, Mingrui Chen, Ning Lu, Yinlong Wen, Yuliang Liu, Dimosthenis Karatzas and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n\t<td class=\"column-1\">inv-12<\/td><td class=\"column-2\">ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich Document Images<\/td><td class=\"column-3\">Wenwen Yu, Chengquan Zhang, Haoyu Cao, Wei Hua, Bohan Li, Huang Chen, Mingyu Liu, Mingrui Chen, Jianfeng Kuang, Mengjun Cheng, Yuning Du, Shikun Feng, Xiaoguang Hu, Pengyuan Lyu, Kun Yao, Yuechen Yu, Yuliang Liu, Wanxiang Che, Errui Ding, Cheng-Lin Liu, Jiebo Luo, Shuicheng Yan, Min Zhang, Dimosthenis Karatzas, Xing Sun, Jingdong Wang and Xiang Bai<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n\t<td class=\"column-1\">inv-13<\/td><td class=\"column-2\">ICDAR 2023 CROHME: Competition on Recognition of Handwritten Mathematical Expressions<\/td><td class=\"column-3\">Yejing Xie, Harold Mouch\u00e8re, Foteini Simistira Liwicki, Sumit Rakesh, Rajkumar Saini, Masaki Nakagawa, Cuong Tuan Nguyen and Thanh-Nghia Truong<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n\t<td class=\"column-1\">inv-14<\/td><td class=\"column-2\">ICDAR 2023 Competition on Recognition of Multi-line Handwritten Mathematical Expressions<\/td><td class=\"column-3\">Chenyang Gao, Yuliang Liu, Shiyu Yao, Jinfeng Bai, Xiang Bai, Lianwen Jin and Cheng-Lin Liu<\/td>\n<\/tr>\n<tr class=\"row-13 odd\">\n\t<td class=\"column-1\">inv-15<\/td><td class=\"column-2\">ICDAR 2023 Competition on RoadText Video Text Detection, Tracking and Recognition<\/td><td class=\"column-3\">George Tom,\u00a0Minesh Mathew, Sergi Garcia,\u00a0Dimosthenis Karatzas\u00a0and\u00a0C V Jawahar<\/td>\n<\/tr>\n<tr class=\"row-14 even\">\n\t<td class=\"column-1\">inv-16<\/td><td class=\"column-2\">ICDAR 2023 Competition on Detecting Tampered Text in Images<\/td><td class=\"column-3\">Dongliang Luo, Yu Zhou, Rui Yang, Yuliang Liu, Xianjin Liu, Jishen Zeng, Enming Zhang, Biao Yang, Ziming Huang, Lianwen Jin and Xiang Bai<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-papers-competitions from cache -->","protected":false},"excerpt":{"rendered":"<p>Journal Track All accepted journal track papers will have an oral presentation at the conference. Oral Presentations Poster Presentations Competitions<\/p>\n","protected":false},"author":3,"featured_media":0,"parent":200,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"nf_dc_page":"","footnotes":""},"_links":{"self":[{"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/pages\/674"}],"collection":[{"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/comments?post=674"}],"version-history":[{"count":5,"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/pages\/674\/revisions"}],"predecessor-version":[{"id":745,"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/pages\/674\/revisions\/745"}],"up":[{"embeddable":true,"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/pages\/200"}],"wp:attachment":[{"href":"https:\/\/icdar2023.org\/wp-json\/wp\/v2\/media?parent=674"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}