Bibliometrické sítě
Relevantní vědecká literatura byla analyzována pomocí bibliometrického mapování.
Tato vizualizační technika prezentuje vzájemné vazby mezi entitami pomocí sítí (uzlových grafů).
Zdrojem dat jsou nejčastěji části vědeckých publikací, jako např. abstrakty, seznam autorů a jejich afiliace nebo seznam citované literatury.
Výsledné sítě následně obsahují uzly, které reprezentují jednotlivé entity (autory, organizace, klíčová slova, citované články) a hrany, které vyjadřují sílu vzájemné vazby mezi jednotlivými dvojicemi.
Pro každou technologii jsme zvolili 3 techniky, které pomáhají zmapovat danou oblast.
Jedná se o
kocitační analýzu položek z referenčních seznamů literatury, dále je to
text-mining abstraktů relevantních publikací a
spolupráce mezi organizacemi spoluautorů na publikacích stažených z WOS.
Výsledky jsou prezentovány v podobě sítí jako interaktivní webová vizualizace, která oproti statickým obrázkům umožňuje detailnější pohled na danou problematiku.
Přechod do interaktivní vizualizace zde
Kocitační analýza
V případě kocitační analýzy jsou zdrojovými daty položky v seznamech citované literatury aktuálních publikací - v našem případech publikací evidovaných databází Web of Science (WoS).
Jedná se zejména o články na příslušné téma, které byly vydáne v roce 2020 nebo začátkem roku 2021. Mezi citovanými položkami mohou všechny typy výstupů - články, review, monografie, sborníkové příspěvky, atd. Může se jednat i o publikace, které nejsou evidované ve WoS.
Často se jedná o zásadní (seminální) práce daného oboru, které mohly být publikovány i před desítkami let. V případě nových technologií to však nebývá příliš časté.
Při kocitační analýze se postupuje tak, že se vezme první seznam literatury a všechny dvojice položek dostanou přidělen kocitační skór roven jedné. Následně se sleduje, zda se nějaká dvojice vyskytuje společně i v některém dalším seznamu citované literatury.
Pokud ano, kocitační skór této dvojice se zvýší o jedna až na hodnotu, která je rovna počtu referenčních seznamů literatury, v nichž se tato dvojice vyskytuje společně. Hlavní myšlenkou je, že položky, které jsou citovány společně, se pravděpodobně zabývají podobným tématem.
Uzly (kruhy) v uzlovém grafu reprezentují jednotlivé citované položky. Jejich velikost (obsah) je monotónní funkcí součtu všech kocitačních skórů, kde je daná položka jednou z dvojice.
Hrany (úsečky) v uzlovém grafu reprezentují jednotlivé dvojice citovaných položek. Jejich šířka je monotónní funkcí kocitačního skóru této dvojice. Berou se do úvahy jen dvojice, jejichž kocitační skór je vyšší než jedna.
Popisky jednotlivých uzlů se sestávají ze jména prvního autora a roku vydání publikace. Tooltip navíc obsahuje i název časopisu nebo identifikátor DOI.
Text-mining
Textový korpus pro textovou analýzu tvoří názvy a abstrakty identifikovaných publikací evidovaných ve WoS. Následně je provedena tokenizace a vyřazeny slovní druhy jako předložky, spojky nebo slovesa.
Zahrnuty jsou pouze podstatná jména a přídavná jména, která tvoří slovní spojení, která budeme nazývat
termíny.
Termíny procházejí dále dvoufázovým filtrováním. Nejdříve se vyloučí termíny, které se vyskytují v textu velmi zřídka (např. v méně než v jednom procentu všech publikací).
Ve druhém kroku se z analýzy vyloučí termíny, které jsou příliš obecné a vyskytují se v mnoha souvislostech.
Výsledné termíny mohou být ještě korigovány za použití tezauru, který může spojovat slova stejného významu do jednoho termínu nebo eliminovat termíny tvořící součásti článků (např. discussion).
Analyzovány jsou následně četnosti výskytu a spoluvýskytu dvojic výsledných termínů. Důležitým výsledkem je shlukování termínů do klastrů, které naznačují, do kterých oblastí daná technologie zasahuje.
Uzly (kruhy) v uzlovém grafu reprezentují jednotlivé termíny. Jejich velikost (obsah) je monotónní funkcí četnosti jejich (binárního) výskytu v publikacích. Jejich barva je indikátorem příslušnosti do určitého klastru.
Hrany (úsečky) v uzlovém grafu reprezentují jednotlivé dvojice termínů vyskytující se v daném abstraktu nebo názvu společně. Jejich šířka je funkcí počtu spoluvýskytů ve všech aktuálních publikacích.
V případě textové analýzy je však síť velmi hustá, protože se každý termín vyskytuje s jiným finálním termínem častokrát alespoň jednou. Více než analýza hran (spojnic) je v analýze důležitější příslušnost termínů do klastrů.
Hrany mohou být ve vizualizaci uživatelem odfiltrovány.
Popisky jednotlivých uzlů se sestávají ze slov nebo slovních spojení oddělených mezerami. V popiscích jsou použita pouze malá písmena.
Spolupráce mezi organizacemi
U každé publikace evidované ve WoS je uveden seznam autorů včetně jejich příslušnosti k určité organizaci. Sídlo organizace se dále nachází v určitém státu.
Existují tedy bibliometrické mapy spolupráce jak na úrovni autorů, organizací, tak i států. Vzhledem k počtu publikací (desítky až stovky) jsme se rozhodli pro střední úroveň a analyzovat spolupráci mezi organizacemi.
Upozorňujeme, že u některých technologií bylo jen málo organizací, které publikovaly více než dva dokumenty. Výsledné sítě jsou tedy triviální a jsou uvedeny jen pro úplnost.
Uzly (kruhy) v uzlovém grafu reprezentují jednotlivé organizace. Nejčastěji se jedná o vysokoškolské a akademické instituce, protože ty jsou na rozdíl od podniků v publikování nejaktivnější.
Hrany (úsečky) v uzlovém grafu reprezentují jednotlivé dvojice organizací. Pokud se na určité publikaci podílelo více autorů ze stejné organizace, byla tato organizace započítána pouze jednou.
Šířka hrany odpovídá počtu publikací, které daná dvojice organizací vyprodukovala společně.
Popisky jednotlivých uzlů se sestávají ze zkráceného názvu organizace.
Ovládání vizualizace
Po zvolení příslušné bibliometrické mapy se objeví na obrazovce uzlový graf, který se sestává z uzlů, hran a popisků. Při najetí kurzorem na uzel či hranu se objeví tooltip se základními informacemi. Dále se na obrazovce nachází dva panely.
Vlevo je panel se základními statistikami a (interaktivní) legendou klastrů. Na pravém panelu se nacházejí tlačítka, pomocí nichž si může uživatel odfiltrovat hrany, uzly, popisky nebo legendu.
V aplikaci je zabudována funcionalita sémantického zoomu, který se ovládá kolečkem na myši nebo dvojklikem na prázdné místo v oblasti grafu. Zoom lze anulovat kliknutím na tlačítko Reset -> Zoom.
Viditelnost popisků je funkcí zoomu. Aplikace umožňuje jednotlivé uzly v síti vyhledat. Vizualizace se zavře po kliknutí na tlačítko Zavřít -> Vizualizaci.