Určování významnosti vrcholů grafu: PageRank a jeho modifikace: technická zpráva č. DCSE/TR - 2013 -9
Files
Date issued
2013
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
V citační analýze existuje mnoho metrik pro měření významu článků, časopisů, autorů atd., jako jsou např. Impact Factor nebo h-index. Tyto metriky ale ve svém výpočtu používají pouze kvantitativní údaje, jako např. počet citací nebo publikací, u kterých nerozlišují kvalitu, tj. při výpočtu je každá citace nebo publikace stejně důležitá. Na základě jejich výsledků lze tedy odlišit populární entity od ostatních, ale již nelze odlišit prestižní entity od populárních entit. Populární entita je často
citována, ale prestižní entita je často citována jinými prestižními entitami. K odlišení prestižních entit je v citační analýze stále častěji používán citační graf a algoritmus PageRank, který významnost entity určuje na základě významu entit, které na ní odkazují. Tímto způsobem PageRank
svým iteračním výpočtem dokáže
odlišit prestižní entity od entit
populárních. Další oblastí, ve které lze PageRank použít, je volba vlastností na základě ontologických vazeb, kde PageRank
umožňuje určit významnost vrcholů v
grafu tvořeném klíčovými slovy dokumentu. Nejvýznamnější termíny
mohou být následně využity k popisu obsahu dokumentu nebo
kategorie, do které bude dokument zařazen. V předkládaném textu
jsou krátce shrnuty historie a aktuální stav citační analýzy, popsány algoritmus PageRank a jemu podobné algoritmy a zmíněny používané bibliografické databáze a vytvářené grafy. Dále text obsahuje soupis vlastních dosud
dosažených výsledků aplikování
PageRanku v oblasti citační analýzy a volby vlastností a popis
budoucích výzkumných záměrů.
Description
Subject(s)
citace, PageRank, graf