Text Line Segmentation in Historical Newspapers

dc.contributor.authorLenc, Ladislav
dc.contributor.authorMartínek, Jiří
dc.contributor.authorKrál, Pavel
dc.date.accessioned2023-12-04T11:00:21Z
dc.date.available2023-12-04T11:00:21Z
dc.date.issued2022
dc.description.abstractČlánek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely.cs
dc.description.abstract-translatedThe paper deals with text line segmentation in historical newspapers. We propose a novel approach which decomposes this problem into two steps: text-block and text-line segmentation. The method should solve issues that may appear in a more commonly used one-step approach. The particular tasks are handled using fully convolutional neural networks. The approach is evaluated on two standard corpora, Europeana and RDCL 2019, and on a novel dataset created from data available in Porta fontium portal. This dataset is freely available for research purposes.en
dc.format
dc.format14 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationLENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743cs
dc.identifier.document-number972697500003
dc.identifier.doi10.1007/978-3-031-23480-4_3
dc.identifier.isbn978-3-031-23479-8
dc.identifier.issn0302-9743
dc.identifier.obd43939531
dc.identifier.uri2-s2.0-85149639546
dc.identifier.urihttp://hdl.handle.net/11025/54900
dc.language.iso
dc.language.isoenen
dc.project.IDEF17_048/0007267/InteCom: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblastcs
dc.publisherSpringer Nature Switzerland AGen
dc.relation.ispartofseriesArtificial Intelligence and Soft Computingen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelůmcs
dc.rights© The Author(s)en
dc.rights.accessrestrictedAccessen
dc.subjectsegmentace obrazových dokumentůcs
dc.subjectanalýza rozložení stránkycs
dc.subjectplně konvoluční neuronové sítěcs
dc.subjectFCNcs
dc.subject.translateddocument image segmentationen
dc.subject.translatedlayout analysisen
dc.subject.translatedfully convolutional networken
dc.subject.translatedFCNen
dc.titleText Line Segmentation in Historical Newspapersen
dc.title.alternativeSegmentace řádek textu v historických novináchcs
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.type.status
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
978-3-031-23480-4_3.pdf
Size:
291.32 KB
Format:
Adobe Portable Document Format