Deep Generalized Max Pooling

dc.contributor.authorChristlein, Vincent
dc.contributor.authorSpranger, Lukas
dc.contributor.authorSeuret, Mathias
dc.contributor.authorNicolaou, Anguelos
dc.contributor.authorKrál, Pavel
dc.contributor.authorMaier, Andreas
dc.date.accessioned2020-03-23T11:00:29Z
dc.date.available2020-03-23T11:00:29Z
dc.date.issued2019
dc.description.abstractGlobal pooling layers are an essential part of Convolutional Neural Networks (CNN). Global average pooling or global max pooling are commonly used for converting convolutional features of variable size images to a fix-sized embedding. However, both pooling layer types are computed spatially independent. In contrast, we propose Deep Generalized Max Pooling that balances the contribution of all activations of a spatially coherent region by re-weighting all descriptors so that the impact of frequent and rare ones is equalized. We show that this layer is superior to both average and max pooling on the classification of Latin medieval manuscripts (CLAMM’16, CLAMM’17), as well as writer identification (Historical-WI’17).en
dc.description.abstractGlobální poolingové vrstvy jsou nezbytnou součástí konvolučních neuronových sítí (CNN). Globální průměrný pooling nebo globální maximální pooling se běžně používají k převodu konvolučních příznaků obrazů s proměnnou velikostí na vektor s pevnou velikostí. Oba typy poolingových vrstev jsou však počítány prostorově nezávisle. Na rozdíl od toho navrhujeme „hluboký zobecněný max pooling“, který upravuje přínos všech aktivací prostorově koherentní oblasti převážením všech deskriptorů tak, aby byl vyrovnáván dopad častých a vzácných. Ukazujeme, že tato vrstva překonává výsledky průměrného i maximálního poolingu v úloze klasifikace latinských středověkých rukopisů (CLAMM’16, CLAMM’17), stejně jako v identifikaci pisatele (Historical-WI’17).cs
dc.format7 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationCHRISTLEIN, V., SPRANGER, L., SEURET, M., NICOLAOU, A., KRÁL, P., MAIER, A.. Deep Generalized Max Pooling. In: The 15th IAPR International Conference on Document Analysis and Recognition. Piscataway: IEEE, 2019. s. 1090-1096. ISBN 978-1-72813-014-9 , ISSN 1520-5363.en
dc.identifier.doi10.1109/ICDAR.2019.00177
dc.identifier.isbn978-1-72813-014-9
dc.identifier.issn1520-5363
dc.identifier.obd43929238
dc.identifier.uri2-s2.0-85079832418
dc.identifier.urihttp://hdl.handle.net/11025/36757
dc.language.isoenen
dc.project.IDLO1506/PUNTIS - Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnostcs
dc.publisherIEEEen
dc.relation.ispartofseriesThe 15th IAPR International Conference on Document Analysis and Recognitionen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© IEEEen
dc.rights.accessrestrictedAccessen
dc.subjectpoolingcs
dc.subjecthluboké učenícs
dc.subjectanalýza dokumentůcs
dc.subjectklasifikace obrazů dokumentůcs
dc.subjectidentifikace pisatelecs
dc.subject.translatedpoolingen
dc.subject.translateddeep learningen
dc.subject.translateddocument analysisen
dc.subject.translateddocument image classificationen
dc.subject.translatedwriter identificationen
dc.titleDeep Generalized Max Poolingen
dc.title.alternativeHluboký zobecněný max poolingcs
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files