Conference papers (NTIS)

Permanent URI for this collection

Browse

Recent Submissions

Showing 1 - 20 out of 343 results
  • Item
    Modelování a identifikace portálových jeřábů
    (Západočeská univerzita v Plzni, 2025) Sukovatý, Daniel
    Příspěvek se zabývá modelováním a identifikací dynamiky portálového jeřábu za účelem návrhu řízení s automatickým tlumením nežádoucích kmitů zavěšené zátěže. Jeřáb je aproximován jako trojité kyvadlo zavěšené na posuvném vozíku, přičemž každé rameno je popsáno polohou těžiště, délkou, hmotností, momentem setrvačnosti a koeficientem tlumení. Pohybové rovnice jsou odvozeny pomocí Lagrangeovy metody a linearizovány v dolní rovnovážné poloze, čímž vzniká stavový model vhodný pro syntézu regulátoru. Pro identifikaci neznámých parametrů zátěže je navržena metoda využívající první dvě rezonanční frekvence systému. Z porovnání charakteristického polynomu matice dynamiky a její Jordanovy formy je sestrojena účelová funkce, jejíž minimum odpovídá fyzikálním parametrům; ta je hledána negradientní optimalizační metodou Pattern Search. Rezonanční frekvence jsou odhadovány experimentálně pomocí reléové zpětné vazby na základě harmonické linearizace. V simulacích dosahují postupy dostatečné přesnosti, u reálného systému se však objevují významné odchylky zejména u druhé rezonance a výpočty parametrů jsou časově náročné. Diskutována je možnost využití online identifikace, například na bázi Kalmanova filtru.
  • Item
    Modelování a identifikace portálových jeřábů
    (Západočeská univerzita v Plzni, 2025) Sukovatý, Daniel
    Příspěvek se zabývá modelováním a identifikací dynamiky portálového jeřábu za účelem návrhu řízení s automatickým tlumením nežádoucích kmitů zavěšené zátěže. Jeřáb je aproximován jako trojité kyvadlo zavěšené na posuvném vozíku, přičemž každé rameno je popsáno polohou těžiště, délkou, hmotností, momentem setrvačnosti a koeficientem tlumení. Pohybové rovnice jsou odvozeny pomocí Lagrangeovy metody a linearizovány v dolní rovnovážné poloze, čímž vzniká stavový model vhodný pro syntézu regulátoru. Pro identifikaci neznámých parametrů zátěže je navržena metoda využívající první dvě rezonanční frekvence systému. Z porovnání charakteristického polynomu matice dynamiky a její Jordanovy formy je sestrojena účelová funkce, jejíž minimum odpovídá fyzikálním parametrům; ta je hledána negradientní optimalizační metodou Pattern Search. Rezonanční frekvence jsou odhadovány experimentálně pomocí reléové zpětné vazby na základě harmonické linearizace. V simulacích dosahují postupy dostatečné přesnosti, u reálného systému se však objevují významné odchylky zejména u druhé rezonance a výpočty parametrů jsou časově náročné. Diskutována je možnost využití online identifikace, například na bázi Kalmanova filtru.
  • Item
    Modelování a identifikace portálových jeřábů
    (Západočeská univerzita v Plzni, 2025) Sukovatý, Daniel
    Příspěvek se zabývá modelováním a identifikací dynamiky portálového jeřábu za účelem návrhu řízení s automatickým tlumením nežádoucích kmitů zavěšené zátěže. Jeřáb je aproximován jako trojité kyvadlo zavěšené na posuvném vozíku, přičemž každé rameno je popsáno polohou těžiště, délkou, hmotností, momentem setrvačnosti a koeficientem tlumení. Pohybové rovnice jsou odvozeny pomocí Lagrangeovy metody a linearizovány v dolní rovnovážné poloze, čímž vzniká stavový model vhodný pro syntézu regulátoru. Pro identifikaci neznámých parametrů zátěže je navržena metoda využívající první dvě rezonanční frekvence systému. Z porovnání charakteristického polynomu matice dynamiky a její Jordanovy formy je sestrojena účelová funkce, jejíž minimum odpovídá fyzikálním parametrům; ta je hledána negradientní optimalizační metodou Pattern Search. Rezonanční frekvence jsou odhadovány experimentálně pomocí reléové zpětné vazby na základě harmonické linearizace. V simulacích dosahují postupy dostatečné přesnosti, u reálného systému se však objevují významné odchylky zejména u druhé rezonance a výpočty parametrů jsou časově náročné. Diskutována je možnost využití online identifikace, například na bázi Kalmanova filtru.
  • Item
    Multi-label Classification and Named Entity Recognition for Historical Documents
    (Springer, 2025) Gruber, Ivan; Hlaváč, Miroslav; Neduchal, Petr; Hrúz, Marek
    In this paper, we present improvements to our processing pipeline for historical document digitization. The original pipeline is extended with two new functionalities - page labeling, and named entity recognition. We handle page labeling as a multi-label classification task, for which we choose the Query2Label approach. Query2Label is tested on our internal NKVD dataset and reaches a mean average precision equal to 80.03% on the test set. For the named entity recognition task we utilize pre-trained transformer-based models DeepPavlov and benchmark them on two entities - person name, and location. The best model reaches promising results despite not being trained on our data at all.
  • Item
    Monitorovací systém pro včelaře
    (Západočeská univerzita v Plzni, 2025) Březina, Pavel
    Včely jsou klíčovými opylovači a hrají zásadní roli v ekosystémech po celém světě. Péče o silná a zdravá včelstva vyžaduje pravidelný dohled, avšak tradiční kontroly úlů jsou časově i fyzicky náročné. Jejich omezená frekvence zvyšuje riziko, že dojde k přehlédnutí raných příznaků nemocí, rojení či ztráty matky. Moderní systémy pro real-time monitorování umožňují tyto události včas detekovat nebo dokonce předpovídat pomocí senzorů a zvukové analýzy. Stávající komerčně dostupná řešení sice nabízejí širokou škálu monitorovacích funkcí, avšak jejich cena je často neúměrně vysoká a pro hobby včelaře finančně nedostupná. Navržený monitorovací systém přináší řešení za dostupnou cenu bez kompromisů na množství poskytovaných informací.
  • Item
    Using Pre-trained Models for Phoneme Representation in Czech Speech Synthesis
    (Západočeská univerzita v Plzni, 2025) Vladař, Lukáš
    Text-to-speech (TTS) systems, i.e., systems producing artificial speech, represent an importanttopic in the field of artificial intelligence. Modern approaches based on neural networksreach very good results, almost comparable to real human speech.Nguyen et al. (2023) argue that including a large-scale pre-trained model for phonemerepresentation in a neural TTS system can further improve the final synthetic speech. We usedtheir pre-trained model called XPhoneBERT to investigate whether it can also enhance the qualityof speech synthesis in the Czech language.
  • Item
    Using Pre-trained Models for Phoneme Representation in Czech Speech Synthesis
    (Západočeská univerzita v Plzni, 2025) Vladař, Lukáš
    Text-to-speech (TTS) systems, i.e., systems producing artificial speech, represent an importanttopic in the field of artificial intelligence. Modern approaches based on neural networksreach very good results, almost comparable to real human speech.Nguyen et al. (2023) argue that including a large-scale pre-trained model for phonemerepresentation in a neural TTS system can further improve the final synthetic speech. We usedtheir pre-trained model called XPhoneBERT to investigate whether it can also enhance the qualityof speech synthesis in the Czech language.
  • Item
    Využití transformerů pro specifickou úlohu z praxe
    (Západočeská univerzita v Plzni, 2025) Tauš, Daniel
    Moderní podnikové systémy, například v logistice, často využívají transakční modely reprezentované XML. Manuální tvorba dokumentace k těmto transakcím a její následné vyhledávání jsou však časově náročné a vedou k nekonzistencím, což omezuje efektivitu. Tato práce proto zkoumá využití modelů architektury Transformer, představené v práci Vaswani et al. (2017), ke zlepšení těchto procesů. Konkrétně se zaměřuje na dvě hlavní oblasti: automatické generování textových popisů transakcí z jejich XML dat; vývoj systému pro efektivní sémantické a hybridní vyhledávání v těchto popisech.
  • Item
    Improving Sign Language Translation through Multimodal Language Alignment
    (Západočeská univerzita v Plzni, 2025) Majer, Filip
    Over 5% of the world’s population experiences disabling hearing loss and many of themrely on sign languages as their primary means of communication. Despite the widespread useof sign languages, most modern communication technologies are designed primarily for spokenlanguage, leaving deaf signers at a significant disadvantage. Recent advances in artificialintelligence offer new opportunities to address these communication barriers.The main objective of this work was to design a new system for sign language translation.At its core is a novel video feature extraction model that combines both spatial and temporalinformation. In addition, the entire system supports pretraining through language alignment.
  • Item
    Využití transformerů pro specifickou úlohu z praxe
    (Západočeská univerzita v Plzni, 2025) Tauš, Daniel
    Moderní podnikové systémy, například v logistice, často využívají transakční modely reprezentované XML. Manuální tvorba dokumentace k těmto transakcím a její následné vyhledávání jsou však časově náročné a vedou k nekonzistencím, což omezuje efektivitu. Tato práce proto zkoumá využití modelů architektury Transformer, představené v práci Vaswani et al. (2017), ke zlepšení těchto procesů. Konkrétně se zaměřuje na dvě hlavní oblasti: automatické generování textových popisů transakcí z jejich XML dat; vývoj systému pro efektivní sémantické a hybridní vyhledávání v těchto popisech.
  • Item
    Improving Sign Language Translation through Multimodal Language Alignment
    (Západočeská univerzita v Plzni, 2025) Majer, Filip
    Over 5% of the world’s population experiences disabling hearing loss and many of themrely on sign languages as their primary means of communication. Despite the widespread useof sign languages, most modern communication technologies are designed primarily for spokenlanguage, leaving deaf signers at a significant disadvantage. Recent advances in artificialintelligence offer new opportunities to address these communication barriers.The main objective of this work was to design a new system for sign language translation.At its core is a novel video feature extraction model that combines both spatial and temporalinformation. In addition, the entire system supports pretraining through language alignment.
  • Item
    Using Pre-trained Models for Phoneme Representation in Czech Speech Synthesis
    (Západočeská univerzita v Plzni, 2025) Vladař, Lukáš
    Text-to-speech (TTS) systems, i.e., systems producing artificial speech, represent an importanttopic in the field of artificial intelligence. Modern approaches based on neural networksreach very good results, almost comparable to real human speech.Nguyen et al. (2023) argue that including a large-scale pre-trained model for phonemerepresentation in a neural TTS system can further improve the final synthetic speech. We usedtheir pre-trained model called XPhoneBERT to investigate whether it can also enhance the qualityof speech synthesis in the Czech language.
  • Item
    Monitorovací systém pro včelaře
    (Západočeská univerzita v Plzni, 2025) Březina, Pavel
    Včely jsou klíčovými opylovači a hrají zásadní roli v ekosystémech po celém světě. Péče o silná a zdravá včelstva vyžaduje pravidelný dohled, avšak tradiční kontroly úlů jsou časově i fyzicky náročné. Jejich omezená frekvence zvyšuje riziko, že dojde k přehlédnutí raných příznaků nemocí, rojení či ztráty matky. Moderní systémy pro real-time monitorování umožňují tyto události včas detekovat nebo dokonce předpovídat pomocí senzorů a zvukové analýzy. Stávající komerčně dostupná řešení sice nabízejí širokou škálu monitorovacích funkcí, avšak jejich cena je často neúměrně vysoká a pro hobby včelaře finančně nedostupná. Navržený monitorovací systém přináší řešení za dostupnou cenu bez kompromisů na množství poskytovaných informací.
  • Item
    Monitorovací systém pro včelaře
    (Západočeská univerzita v Plzni, 2025) Březina, Pavel
    Včely jsou klíčovými opylovači a hrají zásadní roli v ekosystémech po celém světě. Péče o silná a zdravá včelstva vyžaduje pravidelný dohled, avšak tradiční kontroly úlů jsou časově i fyzicky náročné. Jejich omezená frekvence zvyšuje riziko, že dojde k přehlédnutí raných příznaků nemocí, rojení či ztráty matky. Moderní systémy pro real-time monitorování umožňují tyto události včas detekovat nebo dokonce předpovídat pomocí senzorů a zvukové analýzy. Stávající komerčně dostupná řešení sice nabízejí širokou škálu monitorovacích funkcí, avšak jejich cena je často neúměrně vysoká a pro hobby včelaře finančně nedostupná. Navržený monitorovací systém přináší řešení za dostupnou cenu bez kompromisů na množství poskytovaných informací.
  • Item
    Využití transformerů pro specifickou úlohu z praxe
    (Západočeská univerzita v Plzni, 2025) Tauš, Daniel
    Moderní podnikové systémy, například v logistice, často využívají transakční modely reprezentované XML. Manuální tvorba dokumentace k těmto transakcím a její následné vyhledávání jsou však časově náročné a vedou k nekonzistencím, což omezuje efektivitu. Tato práce proto zkoumá využití modelů architektury Transformer, představené v práci Vaswani et al. (2017), ke zlepšení těchto procesů. Konkrétně se zaměřuje na dvě hlavní oblasti: automatické generování textových popisů transakcí z jejich XML dat; vývoj systému pro efektivní sémantické a hybridní vyhledávání v těchto popisech.
  • Item
    Improving Sign Language Translation through Multimodal Language Alignment
    (Západočeská univerzita v Plzni, 2025) Majer, Filip
    Over 5% of the world’s population experiences disabling hearing loss and many of themrely on sign languages as their primary means of communication. Despite the widespread useof sign languages, most modern communication technologies are designed primarily for spokenlanguage, leaving deaf signers at a significant disadvantage. Recent advances in artificialintelligence offer new opportunities to address these communication barriers.The main objective of this work was to design a new system for sign language translation.At its core is a novel video feature extraction model that combines both spatial and temporalinformation. In addition, the entire system supports pretraining through language alignment.
  • Item
    Spatial Analysis of Image Descriptions for Detection of Cognitive Disorders
    (Západočeská univerzita v Plzni, 2025) Lebeda, Tomáš
    Neurodegenerative diseases pose a significant challenge to modern medicine, not onlydue to their progressive and irreversible nature but also because they often remain undiagnoseduntil symptoms become severe. Early detection is essential to maximize the effectivenessof available treatments and to slow the progression of cognitive decline. However, currentdiagnostic approaches are often slow, costly, and inaccessible, typically requiring in-personclinical assessments or expensive procedures like MRI.Research by Bartoš et. al. (2024) has proposed an alternative approach that leveragescognitively demanding tasks - such as describing complex, detailed images in combinationwith other short-term memory tests as a means of early detection.This paper explores the potential of automating the analysis of such image descriptiontasks using machine learning techniques, with the goal of developing a fast, low-cost screeningtool that can be used at home, potentially with the assistance of a family member, therebyreducing the need for in-person clinical visits. Specifically, the focus is on one specific subcomponentof this approach: analyzing the sequence of objects as mentioned during imagedescription.
  • Item
    Nonsense Word Repetition for Detection of Cognitive Disorders
    (Západočeská univerzita v Plzni, 2025) Tupý, Jan
    Cognitive impairments are neurological disorders that disrupt fundamental mental functionssuch as memory, attention, or language. Although they most commonly appear in olderadults, they can also result from brain injuries or psychiatric conditions. Due to the increasingprevalence of these disorders, there is a growing emphasis on early and reliable diagnosis.Traditional diagnostic procedures are time-consuming, which has led to a rising interest in automateddigital testing.One innovative approach involves testing with nonsense words that resemble regularvocabulary but lack meaning. This method enables researchers to focus on pure cognitiveprocesses without interference from semantic context. The aim of this study is to investigatewhether this type of task can provide objective and quantitative data on the state of cognitivefunctions and support the development of effective digital diagnostic tools.
  • Item
    Towards Aesthetic Enrichment of Mirror Selfies via Automatic Image Analysis
    (Západočeská univerzita v Plzni, 2025) Vyskočil, Jiří; Zejkanová, Kristina
    Mirror selfies have become a common form of self-expression on social media, often shared for their aesthetic value. This trend inspired a collaboration with the Ladislav Sutnar Faculty of Design and Art to explore how design elements — such as chairs or decorative objects — might enhance these images. We developed a system for automatic analysis of mirror selfies collected from social networks. The goal is to automatically extract visual metadata, including color palettes, human poses, face occlusion by phones, subject placement (e.g., golden ratio), and object directions relative to the person. The obtained metadata can support the creation of design elements that make selfies more visually appealing.
  • Item
    Animal Identification with Independent Foreground and Background Modeling
    (Springer, 2025) Picek, Lukáš; Neumann, Lukáš; Matas, Jiří
    We propose a method that robustly exploits background andforeground in visual identification of individual animals. Experiments show that their automatic separation, made easy with methods like Segment Anything, together with independent foreground and backgroundrelated modeling, improves results. The two predictions are combined in a principled way, thanks to novel Per-Instance Temperature Scaling that helps the classifier to deal with appearance ambiguities in training and to produce calibrated outputs in the inference phase. For identity prediction from the background, we propose novel spatial and temporal models. On two problems, the relative error w.r.t. the baseline was reduced by 22.3% and 8.8%, respectively. For cases where objects appear in new locations, an example of background drift, accuracy doubles.