Lukáš Jirůšek
Bakalářská práce

Název bakalářské práce

Český název

Agregace otevřených dat o počtu cizinců v České republice pomocí relačně databázové technologie

Anglický název

Aggregation of open data on number of foreigners in the Czech Republic using relation database technology

Klíčová slova

open data, agregace dat, relační databáze, cizinci v České republice, dotazovací jazyk SQL

Cíl práce

Cílem této práce je navrhnout a vytvořit relační databázi pro ukládání dat o počtu cizinců v České republice.

Dílčím cílem je také stáhnout data z Národního katalogu otevřených dat a tyto data vhodně zpracovat a nahrát je do databáze.

Tato databáze pak umožní snadnou agregaci těchto dat, což také poslouží k vizualizaci těchto dat a vytvoření kartogramů.

Screenshot stránky Národního katalogu otevřených dat
Screenshot stránky Národního katalogu otevřených dat

Metodika

V teoretické části této práce budou popsány funkcionality a vlastnosti relačních databází a jazyka SQL.

Vlastní práce rozdělí do několika kroků, prvním z nich bude stažení a zpracování dat ve formátu CSV stažené z Národního katalogu otevřených dat. K tomuto zpracování bude využit programovací jazyk Python.

Druhým krokem pak bude vytvoření databáze a chodného relačního schématu pro uložení těchto dat. Tato databáze musí být normalizována, samotná databáze bude implementována knihovnou SQLite, především díky volné licenci a snadné integraci do programovacího jazyka Python. Námi zpracována data pak budou do této databáze nahrána.

Dalším krokem je pak vytvoření vhodných agredačních dotazů nad těmito daty, ty budou například sčítat počty cizinců v jednotlivých krajích nebo okresech, sčítat jednotlivé národnosti a nebo sledovat změnu počtu cizinců v čase.

Posledním krokem je pak využít tyto agragační dotazy k vytvoření kartogramůa případně vytvořit webovou stránku kde budou tyto data přehledně prezentována.