PlaceMania.sk vznikol s cieľom prinášať presné, aktuálne a dôveryhodné informácie o miestach, krajinách a geografických zaujímavostiach z celého sveta. Pri práci s obsahom prepájame verejné dátové zdroje, vlastné automatizované spracovanie a redakčné overovanie. Dôraz kladieme na transparentnosť zdrojov, priebežnú aktualizáciu údajov a kontrolu presnosti pred publikovaním.
Automatizovane spracovávané zdroje
Veľká časť faktografických údajov na PlaceMania.sk vychádza z overených verejne dostupných a medzinárodne používaných databáz. Tieto zdroje nespracúvame jednorazovo, ale automatizovane ich v rôznych intervaloch priebežne kontrolujeme, aktualizujeme a zapisujeme do vlastnej dátovej vrstvy.
Pri spracovaní údaje prepájame cez identifikátory, kódy a väzby medzi zdrojmi, čistíme ich, validujeme a normalizujeme tak, aby sme pracovali s konzistentnými údajmi naprieč celým webom. Tam, kde je to možné, ich zároveň porovnávame medzi viacerými zdrojmi, aby sme znížili riziko nepresností.
Ako hlavné dátové zdroje využívame najmä:
Wikidata, Wikipedia a externé identifikátory
Pri časti údajov pracujeme s vlastnou automatizáciou nad verejnými zdrojmi Wikidata, Wikipedia a RestCountries. Tam, kde je dostupný jednoznačný identifikátor z Wikidata, vieme naň naviazať ďalšie štruktúrované údaje a verejné identifikátory. Tieto dáta následne validujeme, deduplikujeme a normalizujeme, vrátane jazykových variantov a ISO kódov, aby sme pracovali s konzistentnými údajmi naprieč zdrojmi.
Google Places API
Pri časti údajov o miestach pracujeme s vlastnou automatizáciou nad Google Places API (New). Miesta neviažeme len na textový názov alebo adresu, ale na jednoznačné Place ID, nad ktorým následne získavame štruktúrované údaje zo zdroja. Tie potom čistíme, validujeme a normalizujeme do jednotnej podoby vrátane adresných komponentov, typov miesta a ďalších atribútov, aby sme nepracovali s neaktuálnymi alebo nekonzistentnými údajmi.
Časové pásma
Údaje o časových pásmach neudržiavame ručne. Používame vlastnú automatizáciu nad Google Time Zone API, ktorá zo súradníc získava IANA timeZoneId pre konkrétne miesto a ukladá ho k záznamu. Vďaka tomu pracujeme s jednoznačne určeným časovým pásmom namiesto približného priradenia podľa názvu lokality alebo krajiny.
Klimatické údaje
Pri časti klimatických údajov pracujeme s vlastnou automatizáciou nad verejnými API službami Open-Meteo. Základom sú presné súradnice miesta, na základe ktorých automatizovane získavame vybrané meteorologické, atmosférické a doplnkové údaje, najmä o teplotách, zrážkach, oblačnosti, vetre, vlhkosti, viditeľnosti, kvalite ovzdušia a nadmorskej výške.
Alternatívne názvy lokalít
Pri geografických názvoch pracujeme s vlastnou automatizáciou, ktorá spracúva verejne dostupné dáta GeoNames. Pre lokality s priradeným GeoNames ID automatizovane získavame zodpovedajúce alternatívne názvy, pričom nespracúvame celý dataset bez rozdielu, ale len záznamy naviazané na konkrétne miesta v našich dátach.
Tieto údaje následne čistíme a normalizujeme — zjednocujeme jazykové kódy, odstraňujeme technické alebo nevhodné záznamy, ošetrujeme diakritiku, interpunkciu a duplicitné varianty názvov. Vďaka tomu pracujeme s konzistentnejšími názvami lokalít naprieč zdrojmi.
OpenStreetMap (OSM)
Pri časti geografických údajov pracujeme s identifikátormi OpenStreetMap, ktoré získavame cez väzby z Wikidata. Tie nám umožňujú prepájať vybrané miesta s konkrétnymi objektmi v OpenStreetMap a odkazovať na ich verejný záznam.
UNESCO World Heritage List
Pri časti údajov pracujeme s vlastnou automatizáciou nad verejným datasetom UNESCO World Heritage Centre. Ak má záznam priradené UNESCO ID, systém k nemu automatizovane získava vybrané štruktúrované údaje, napríklad názov, rok zápisu, prípadný rok vyradenia, kategóriu alebo informáciu o ohrození. Tieto údaje následne zapisujeme do vlastných polí a pri vybraných hodnotách ich aj normalizujeme do jednotnej podoby.
Letiská
Pri údajoch o letiskách pracujeme s vlastnou automatizáciou, ktorá spracúva verejne dostupné databázy a prepája ich do jednotného základu. Základ tvorí dataset OurAirports, z ktorého vyberáme letiská s IATA kódom a pravidelnou prevádzkou. Tieto dáta následne obohacujeme o ďalšie informácie z WikiData, napríklad o názov letiska, web, mesto, polohu, nadmorskú výšku, obrázok alebo rok otvorenia. Pri ich zaradení používame normalizáciu podľa krajín a regiónov, aby boli údaje naprieč zdrojmi konzistentné.
Medzinárodné vodičské dohovory
Pri údajoch o medzinárodnom vodičskom preukaze pracujeme s vlastnou automatizáciou, ktorá kontroluje verejne dostupné zdroje Organizácie Spojených národov. Konkrétne ide o údaje z UN Treaty Collection k Ženevskému dohovoru o cestnej premávke (1949) a Viedenskému dohovoru o cestnej premávke (1968), ktoré prepájame so štandardizovanými kódmi krajín podľa UN M49. Vďaka tomu vieme priebežne aktualizovať, pri ktorých krajinách evidujeme väzbu na príslušný dohovor, a znižovať riziko chýb spôsobených rozdielnym názvoslovím štátov v rôznych zdrojoch.
Cestovné a vízové informácie
Údaje o vízových povinnostiach neudržiavame ručne. Používame vlastnú automatizáciu nad externým API zdrojom, ktorá pracuje s krajinami identifikovanými cez platné ISO kódy. Získané údaje najprv ukladáme do medzivrstvy a následne ich párujeme s krajinami v databáze, prekladáme vybrané hodnoty a zapisujeme do vlastných polí. Pri chýbajúcich alebo chybných dátach zároveň odstraňujeme staré hodnoty, aby sme nepracovali s neaktuálnymi údajmi.
Pravidelná automatizovaná aktualizácia dát
PlaceMania.sk nie je statický web, na ktorom údaje po zverejnení zostanú bez pohybu. Vybrané informácie priebežne aktualizujeme a kontrolujeme tak, aby bol obsah čo najčerstvejší, najpresnejší a dlhodobo dôveryhodný v rámci možností verejne dostupných zdrojov. Ak sa objaví novšia, presnejšia alebo lepšie doložená informácia, obsah po overení priebežne upravujeme. Naším cieľom je, aby údaje nezostávali „zamrznuté v čase“, ale aby sa priebežne dopĺňali, spresňovali a porovnávali. Automatizácia nám v tom pomáha, no dôležité informácie a textové výstupy zároveň prechádzajú aj redakčnou kontrolou.
Manuálne overovanie a redakčná práca
Automaticky spracované údaje vnímame ako základ, nie ako konečný výsledok. Pri rozpore údajov dávame prednosť oficiálnym a autoritatívnym zdrojom pred agregovanými databázami. Pri rozšírených článkoch, tematických textoch a profiloch miest údaje dopĺňame a kontrolujeme manuálne.
Pracujeme najmä s oficiálnymi webmi inštitúcií a atrakcií, odbornými článkami a publikáciami, cestovateľskou literatúrou, atlasmi, historickými zdrojmi a ďalšími overenými verejnými podkladmi. Fakty porovnávame z viacerých zdrojov, aby sme minimalizovali nepresnosti a doplnili kontext, ktorý samotné databázy často neobsahujú.
Využívanie nástrojov umelej inteligencie
Pri práci s väčšími datasetmi, rozsiahlejšími textami a porovnávaní zdrojov využívame aj nástroje umelej inteligencie. Pomáhajú nám najmä pri sumarizácii podkladov, identifikácii rozporov v údajoch, práci s väčším množstvom informácií a pri návrhoch štruktúry obsahu.
Umelú inteligenciu však používame len ako pomocný nástroj, nie ako náhradu redakčnej práce. Výstupy pred publikovaním manuálne kontrolujeme, upravujeme a posudzujeme v kontexte ostatných zdrojov. Za finálne znenie a faktickú správnosť publikovaného obsahu vždy zodpovedá človek, nie nástroj.
Časovo citlivé údaje
Niektoré informácie sa menia rýchlejšie než iné. Týka sa to najmä otváracích hodín, cien vstupov, prevádzkových obmedzení, sezónnych zmien, dopravných informácií alebo cestovných a vízových podmienok.
Pri takýchto údajoch máme nastavenú častejšiu automatizovanú kontrolu a aktualizáciu než pri stabilnejších dátach. Napriek tomu pri praktickom rozhodovaní odporúčame finálne overenie na oficiálnom zdroji, najmä ak ide o návštevu, cestu alebo úradný postup.