The System for Efficient Indexing and Search in the Large Archives of Scanned Historical Documents
| dc.contributor.author | Bulín, Martin | |
| dc.contributor.author | Švec, Jan | |
| dc.contributor.author | Ircing, Pavel | |
| dc.date.accessioned | 2025-06-20T08:56:43Z | |
| dc.date.available | 2025-06-20T08:56:43Z | |
| dc.date.issued | 2023 | |
| dc.date.updated | 2025-06-20T08:56:43Z | |
| dc.description.abstract | The paper introduces software capable of indexing and searching large archives of scanned historical documents. The system capabilities are demonstrated on the collection containing documents from the archives of the post-Soviet security services. The backend of the system was designed with a focus on flexibility (it is actually already being used for other related tasks) and scalability to larger volumes of data. The graphical user interface design has been consulted with historians interested in using the archived documents and was developed in several iterations, gradually including the changes induced both by the user’s requests and by our improving knowledge about the nature of the processed data. | en |
| dc.description.abstract | Představujeme software schopný indexovat a vyhledávat velké archivy naskenovaných historických dokumentů. Schopnosti systému jsou demonstrovány na sbírce obsahující dokumenty z archivů postsovětských bezpečnostních služeb. Backend systému byl navržen s důrazem na flexibilitu (v současnosti je již používán i pro jiné související úkoly) a škálovatelnost pro zpracování většího objemu dat. Design grafického uživatelského rozhraní byl konzultován s historiky, kteří mají zájem o využití archivovaných dokumentů, a byl vyvíjen postupně v několika iteracích, zahrnující změny, které byly způsobeny jak požadavky uživatelů, tak naším stále se zlepšujícím poznáním o povaze zpracovávaných dat. | cz |
| dc.format | 5 | |
| dc.identifier.document-number | 000995495200015 | |
| dc.identifier.doi | 10.1007/978-3-031-28241-6_15 | |
| dc.identifier.isbn | 978-3-031-28240-9 | |
| dc.identifier.issn | 0302-9743 | |
| dc.identifier.obd | 43940528 | |
| dc.identifier.orcid | Bulín, Martin 0000-0003-0276-3143 | |
| dc.identifier.orcid | Švec, Jan 0000-0001-8362-5927 | |
| dc.identifier.orcid | Ircing, Pavel 0000-0001-6967-1687 | |
| dc.identifier.uri | http://hdl.handle.net/11025/61626 | |
| dc.language.iso | en | |
| dc.project.ID | SGS-2022-017 | |
| dc.project.ID | LM2023062 | |
| dc.publisher | Springer | |
| dc.relation.ispartofseries | 45th European Conference on Information Retrieval (ECIR 2023) | |
| dc.subject | indexing | en |
| dc.subject | GUI design | en |
| dc.subject | OCR | en |
| dc.subject | scanned documents | en |
| dc.subject | indexace | cz |
| dc.subject | webové uživatelské rozhraní | cz |
| dc.subject | OCR | cz |
| dc.subject | vyhledávání ve skenovaných dokumentech | cz |
| dc.title | The System for Efficient Indexing and Search in the Large Archives of Scanned Historical Documents | en |
| dc.title | Systém pro efektivní indexaci a vyhledávání v rozsáhlých archivech skenovaných historických dokumentů | cz |
| dc.type | Stať ve sborníku (D) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 785181 | * |
| local.has.files | yes | * |
| local.identifier.eid | 2-s2.0-85151066220 |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- 978-3-031-28241-6_15.pdf
- Size:
- 766.78 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: