Nejčastější dotazy k otevřeným datům

Obecné dotazy

Co jsou otevřená data?

Otevřená data jsou informace a data (různé statistiky, rozpočty, přehledy, databáze apod.) zveřejněná na internetu. Jsou publikována v úplné podobě bez záměrného odstraňování vybraných údajů, jsou snadno dostupná, strojově čitelná a používají standardy s volně dostupnou specifikací. Zpřístupněna jsou za jasně definovaných podmínek užití dat, ale s minimem omezení a dostupná jsou všem uživatelům zdarma. Otevřená data ČSSZ jsou použitelná bez omezení.

Zpět na začátek

Co portál otevřených dat ČSSZ nabízí?

Portál otevřených dat ČSSZ umožňuje vyhledávat datové sady, seznámit se s jejich katalogizačními záznamy a dokumentací. Datové sady si mohou uživatelé stáhnout pomocí uvedených odkazů, případně mohou nad daty spouštět vlastní dotazy v jazyce SPARQL. Spouštění vlastních dotazů je umožněno zpřístupněním tzv. SPARQL endpointu, který je dostupný na adrese https://data.cssz.cz/sparql. Pro dotazování nad daty s využitím jazyka SPARQL lze využít i připravený formulář dostupný na adrese https://data.cssz.cz/sparql-query-editor.

Pro snadné využití otevřených dat ČSSZ v běžných kancelářských aplikacích jsou data poskytována také ve formátu CSV.

Pro zajištění dohledatelnosti dat jsou otevřené datové sady ČSSZ opatřeny metadaty, která lze procházet na portálu otevřených dat ČSSZ. Metadata jsou ale také poskytována ve strojově čitelné podobě. V souladu se Standardy publikace a katalogizace otevřených dat veřejné správy v ČR připravovanými Ministerstvem vnitra České republiky jsou otevřené datové sady ČSSZ rovněž registrovány v Národním katalogu otevřených dat.

Na portálu otevřených dat jsou k dispozici také vizualizace, které zjednodušují uživatelům náhled na data dostupná doposud pouze ve strojově čitelné podobě. K jednotlivým vizualizacím lze přistoupit odkazem z katalogizačních záznamů datových sad. Většina grafů je vybavena filtry, které umožňují uživateli zadat konkrétní výběrové podmínky pro jejich vykreslení. Datový podklad pro graf je možno rovněž zobrazit jako tabulku, případně uložit ve formátu CSV a takto získaná data dále cíleně zpracovávat pomocí programu Excel.

Zpět na začátek

Jaká data ve formátu otevřených dat jsou publikována na portále otevřených dat ČSSZ?

Na portále otevřených dat ČSSZ jsou zveřejněna pouze agregovaná data, která se již většinou nachází ve statistických ročenkách, výročních zprávách, zprávách o činnosti nebo jsou zveřejněna na webových stránkách ČSSZ v jiné formě. V těchto případech se jedná o jiný způsob zveřejnění dat spojený zpravidla s vizualizací těchto dat ve formě interaktivních grafů.

Nejsou uveřejněna žádná data, která by byla v rozporu se zákonem na ochranu osobních údajů, tj. nezveřejňují se žádné individuální nebo osobní údaje.

Zpět na začátek

Technické dotazy

Co je formát RDF?

Resource Description Framework (RDF) je datový model pro reprezentaci dat v síti WWW vytvořený a spravovaný konsorciem W3C. Data reprezentuje v podobě trojic: subjekt, predikát a objekt.

Trojice reprezentuje hodnotu (zapsanou v místě objektu) vlastnosti (zapsanou v místě predikátu) nějaké entity (zapsané v místě subjektu). Subjektem je vždy entita. Objektem může být buď primitivní datová hodnota (řetězec, číslo apod.) nebo jiná entita. Predikátem je vlastnost subjektu, pro kterou chceme v trojici reprezentovat hodnotu.

Formát RDF je standardem reprezentace distribucí datových sad na stupni otevřenosti 4 a 5. Distribuce jsou pak zapisovány v jednom z formátů pro zápis datového modelu RDF v kódování UTF-8.

Zpět na začátek

Co je formát CSV?

Comma-separated values (CSV) je jednoduchý souborový formát určený pro výměnu tabulkových dat. Soubor ve formátu CSV sestává z řádků, ve kterých jsou jednotlivé položky odděleny znakem čárka (,).

Zpět na začátek

Proč se špatně zobrazují české znaky při otevření souboru ve formátu CSV v aplikaci MS Excel?

Pro korektní zobrazení češtiny v souborech s kódováním UTF-8 je vhodné použít postup, který je ke stažení ZDE.

Zpět na začátek