The representation of some phrases in Arabic word semantic vector spaces
Date issued
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
IEEE
Abstract
Demonstrujeme několik cest pro použití morfologických slovních analogií na testování reprezentací komplexních slov v sémantických prostorech. Prezentujeme množinu morfologických relací, kde každá z nich může být použita pro generování mnoho slovních analogií. 1) Ukazujeme, že rozdíly vektorů slov v páru se stejnou vzájemnou relací, jsou přibližně paralelní. 2) Navrhujeme, že sčítání vektorů rozdílů, je užitečná operace pro budování frázových vektorů. 3) Ukazujeme, že páry se stejnou relací mohou mít podobné poměry četností v korpusu. 4) Představujeme způsob, jak mohou být homografy se stejnými sémantickými vektory separovány do jiných vektorů pro různé významy, a to za pomocí odhadu četností a zarovnávacích podmínek získaných ze slovních analogií. 5) Pozorujeme, že některé naše analogie jsou paralelní a mohou být kombinovány. Používáme arabská slova jako případovou studii, protože arabská ortografie obsahuje slovesné konjugace, předmětná zájmena, a mnoho dalších lingvisticky zajímavých vlastností. Proto je velké množství frází, sestavených z jednoduchých složek, již obsaženo v sémantických prostorech pro arabštinu dostupných na internetu. Podobné fráze v angličtině vyžadují zahrnutí bigramů či trigramů jako lemmat ve slovních reprezentacích. I přesto morfologie angličtiny umožnuje jiné vztahy v sémantických prostorech, které v arabštině neexistují (například negace). Nově vzniklý korpus morfologických relací je dostupný pro ostatní výzkumníky.
Description
Subject(s)
Arabština, Frázové sémantické vektory, Slovní analogie, Slovní reprezentace
Citation
OROSZ, T., POÓR, P., KARBAN, P., PÁNEK, D. Power transformer design optimization for carbon footprint. In: 2019 Electric Power Quality and Supply Reliability Conference (PQ) & 2019 Symposium on Electrical Engineering and Mechatronics (SEEM) : /proceedings/. Piscataway: IEEE, 2019. s. 1-4. ISBN 978-1-72812-650-0.