ANALÝZA: Jak jsou mezi sebou propojené tzv. antisystémové weby
Pokud chce člověk rozplést širokou síť pseudozpravodajských (antisystémových) webů, které tíhnou k propagaci prokremelského vidění světa, alternativního pohledu na válku v Sýrii nebo anexi Krymu, má několik možností.
Z veřejně dostupných zdrojů si může alespoň základním způsobem digitálně vzdělaný jedinec začít slepovat mozaiku, která mu sice nikdy nevytvoří přesný a jednoznačný obraz o situaci, nicméně i dílčí poznání jsou často zajímavá.
Šlerka vytipoval čtyřicítku tzv. antisystémových webů. Jednou z metod, jak zjistit vzájemnou propojenost těchto serverů, je tzv. referral. Tedy odkud uživatelé na tento server přišli a kam odešli. Pro tento účel studenti využili veřejně dostupný web https://www.similarweb.com/, kde získali data o tom, odkud návštěvníci daného webu nejčastěji přichází a kam následně směřují. Poté bylo potřeba data pročistit (např. očistit o velké servery sociálních sítí typu youtube.com, twitter.com a facebook.com apod.) a následně vše vizualizovat v programu Gephi.
Jedno takové cvičení přichystal i český sémiotik a odborník na analýzu dat ze sociálních sítí Josef Šlerka pro studenty magisterského oboru Studia nových médií.
Předně je potřeba zdůraznit, že jde opravdu jen o nesyntetický příklad, který měl i zároveň studentům ukázat, kde jsou možné limity takového zkoumání. Jak sám Šlerka uvedl na Facebooku: „Neusuzoval bych z toho nic absolutního, spíš to jen přikládal k jiným dílkům.“
Kdo kam chodí, je vidět podle směrovek: čím větší bod, tím víc na něj odchází návštěvníci jednotlivých webů. Barvy jsou určené algoritmicky, tedy jsou zklastrované do několika skupin. Jak je z grafu vidět, dominantní úlohu zastávají Parlamentní listy a jeho subdomény a server zvědavec.cz, který je z těchto webů nejstarší.
Grafy jsou sice zajímavé vizuálně, ale pokud chceme opravdu něco vyčíst, je potřeba se podívat na samotná data. Důležitým údajem v teorii grafů je pojem in-degree. V našem případě jde o stránky, ze kterých uživatelé nejčastěji přicházejí. Největší in-degree v naší soustavě mají servery zvedavec.org (11) a parlamentnilisty.cz (10). Naopak kam nejčastěji uživatelé z daného serveru odchází, nám ukáže číslo out-degree. V této kategorii vítězí nwoo.cz (19), pravdive.eu (11) a ac24.cz (11). Další zajímavou statistikou je Betweenness centrality, která ukazuje na to, jaké uzly jsou v síti nejdůležitější. Zde výrazně bodují opět Parlamentní listy a jejich subdoména euserver.
Více z pořadu
E-shop Českého rozhlasu
Víte, kde spočívá náš společný ukrytý poklad? Blíž, než si myslíte!
Jan Rosák, moderátor
Slovo nad zlato
Víte, jaký vztah mají politici a policisté? Kde se vzalo slovo Vánoce? Za jaké slovo vděčí Turci husitům? Že se mladým paním původně zapalovalo něco úplně jiného než lýtka? Že segedínský guláš nemá se Segedínem nic společného a že známe na den přesně vznik slova dálnice? Takových objevů je plná knížka Slovo nad zlato. Tvoří ji výběr z rozhovorů moderátora Jana Rosáka s dřívějším ředitelem Ústavu pro jazyk český docentem Karlem Olivou, které vysílal Český rozhlas Dvojka.