Denník N

Pavol Škápik: Petržalský poslanec, ktorý dátami zlepšuje spravovanie Bratislavy

V dnešnom rozhovore budeme diskutovať s vedúcim tímu dátových analytikov na Magistráte hlavného mesta SR Bratislavy a našim spoluzakladateľom OZ Klebe(da)ta Pavlom Škápikom.
Pavol Škápik vyštudoval sociológiu na Trnavskej univerzite v Trnave a od novembra 2018 je petržalským poslancom, ktorý sa do politiky snaží priniesť odbornosť a zmeny na základe dát, nie na základe pocitov. Predtým pracoval na analytickom Inštitúte sociálnej politiky Ministerstva práce, sociálnych vecí a rodiny SR.

Vieš nám opísať, ako si sa stal dátovým analytikom? Kto je to vlastne dátový analytik?

Už od malička ma zaujímali súvislosti či závislosti, resp. či jedna vec ovplyvňuje druhú, a ak áno, v akom rozsahu. Čo je potrebné zmeniť aby bol výsledok taký, aký sa snažíme dosiahnuť a podobne. Jednoducho  ako v živote, tak aj v dátach je množstvo súvislostí, dôležité je zistiť ich, a tu zábava nekončí, ale len začína.

To znie zaujímavo. Kedy a kde si začínal komplexnejšie pracovať s dátami? A pri akej príležitosti?

Mojou prvou „školou dát“ bol Štatistický úrad SR a národný projekt Sčítanie obyvateľov, domov a bytov 2011. Od mája 2014 som viedol tím odborníkov, ktorý mal na starosti prípravu Sčítania obyvateľov, domov a bytov 2021, ktoré bude vychádzať z dostupných údajov obsiahnutých v registroch. Táto skúsenosť bola jedinečná, ale zároveň náročná pretože ide na Slovensku o prvé sčítanie, pri ktorom bude počet obyvateľov a aj viaceré údaje o obyvateľoch pochádzať zo štátnych registrov a evidencii a už sa na tieto údaje nebude potrebné pýtať od obyvateľov. Bolo to množstvo práce pri analýze premenných pri jednotlivých registroch od referenčných, ako Register fyzických osôb cez rezortné ako je rezortný informačný systém Ministerstva školstva, vedy, výskumu a športu SR či evidencia uchádzačov o zamestnanie z Ministerstva práce sociálnych vecí a rodiny SR až po údaje pochádzajúce z Úradu geodézie, kartografie a katastra, Zväzu väzenskej a justičnej stráže či Sociálnej poisťovne.

To je rozsiahli súbor dát, s ktorými si pracoval. Keď hľadáš súvislosti v dátach, predpokladám, že prepájaš aj viacero zdrojov? Pokiaľ sú dáta nekompletné upravuješ ich nejako? Keď som sa pripravoval na rozhovor, tak som sa stretol s pojmami ako integrácia či imputácia. Vieš nám ich v krátkosti vysvetliť?

To iba tak znie, do „dátovej hantírky“ sa veľmi rýchlo dostane, lebo dáta sú vášeň, a keď Vás práca baví nie je nič lepšie. Integrácia zjednodušene znamená, spájanie zdrojových dát pomocou spoločných menovateľov alebo súvislostí.. V prípade imputácii, pokiaľ máte dostatočné množstvo údajov viete štatisticky doplniť údaje v intervale určitej pravdepodobnosti. Takto práve aj pracujeme s dátami, ak je niečo v dvoch rozdielnych registroch, tak ich prepojím a ak je niečo nekompletné a nájdem metódu, ktorou to viem doplniť, tak aj doplním.


Čím viac o tom rozprávaš tým viac ma to začína zaujímať. Je potrebné mať nejaké špecifické vzdelanie na túto prácu.

Niektorí si myslia, že na Štatistickom úrade SR robia iba matematici a štatistici, no nie je to pravda. Pracujú tam aj sociológovia, demografi či učitelia.

Na dátovú analytiku nie je vyslovene potrebné špecifické vzdelanie, i keď je určite výhodou. Môže to robiť v podstate každý, podstatné ale je aby mal základne kombinačné schopnosti, záujem o hľadanie súvislostí a znalosť základných štatistických a matematických metód. Ono je veľmi náročné generalizovať potrebné vzdelanie na toto povolanie nakoľko je veľmi rôznorodé a častokrát prierezové. Na jednej strane sú to tvrdé zručnosti v podobe scriptovania či programovania, aspoň obmedzená znalosť metód a technológií a na záver soft skills v podobe schopnosti písania zrozumiteľného textu a prezentovania výsledkov analýz. Dá sa však povedať, že záleží na charaktere tej ktorej analytickej pozície. Niekto môže analyzovať štruktúrované údaje z podnikových systémov, ďalší textové dáta a vyhodnocovať ich sentiment, niekto iný zase neštruktúrované údaje v podobe BigData (obrázky či videá).

Motto, ktorým sa však ja riadim je „Kto chce hľadá spôsob, kto nechce hľadá dôvod“ a o tomto práve analytika je. O hľadaní riešení, nikdy nekončiacom vzdelávaní sa, a o prebdených nociach.

Čiže každý z nás môže byť dátový analytik?

Je potrebné rozlíšiť pozície v dvoch asi základných kategóriách, a to dátový analytik alebo data scientist. V prvom prípade ide o pozíciu, ktorá je založená na pravidelnom reportovaní nejakých súvislostí alebo zmien, v druhom prípade ide o skutočné hľadanie príčinných súvislostí a aj nastavovanie procesov.

Teraz úprimne, nemôže sa stať, že ak bude narastať počet analytikov za chvíľu nebudú mať čo robiť?

V prvom rade si treba uvedomiť, že dáta sa zbierajú (a teda vznikajú) všade. Ako príklad z bežného života by som uviedol bežný deň obyčajného človeka. Celý deň je tvoja poloha a pohyb monitorovaná operátorom, ktorý takéto dáta o tebe zbiera a uchováva. Ráno po prebudení a prečítaní emailov sa táto informácia uloží u prevádzkovateľa týchto služieb. Ak cestuješ do práce či školy s MHD tak o tom prostriedok (autobus, električka) zbiera údaje. Dnes je bežné, že v mestách sú rozmiestnené bezpečnostné kamery z ktorých sa dajú zbierať údaje pomocou „metód procesovania obrázkov“ (image processing). A v neposlednej rade tvoj zamestnávateľ pozná čas tvojho príchodu či odchodu z práce.  Nehovoriac o tom že v daný deň si ešte pôjdeš nakúpiť, zaplatíš kartou alebo prehliadaš web stránky. Čiže odpoveď na tvoju otázku znie nie, stať sa to nemôže.

Aké ciele máš vlastne ako dátový analytik? Čo sa snažíš dosiahnuť?

Medzi dátovými analytikmi sa hovorí, že „Dátový analytik rozpráva príbeh, ktorý píšu dáta.“ Platí, to aj v reáli, pretože mojím cieľom je dávať zmysel údajom a vedieť ich správne a korektne interpretovať. Podstatné je správne interpretovať význam, ktorý je skrytý v dátach. V súčasnosti sa stretávam s nedostatkom pochopenia významu údajov. Ono to ide ruka v ruke so skutočnosťou, že nestačí dáta mať a vedieť ich interpretovať, ale v rámci mojej praxe som sa stretol aj s problémom neschopnosti nadriadených takéto dáta vedieť efektívne využiť. Čiže dátová gramotnosť je aj na manažérskych pozíciách určite už dnes skôr nutnosťou ako výhodou.

Keď hovoríte o tom, že zmysel je skrytý v dátach, čo ste odhalili?

Takto narýchlo ma napadajú dve veci, ktoré ma tak trocha prekvapili. Prvou bolo, že podiel žien poberajúcich materskú či príspevok pri narodení dieťaťa klesá okres po okrese smerom na východ. Toto znamená, že aj nárok poberateliek na tieto príspevky je silno regionálne diferencovaný. Druhým je príklad z oblasti dopravy, kedy sme analyzovali BUSpruhy na Gagarinovej ulici v Bratislave. Málokto vie, že v autobusoch, električkách či trolejbusoch v meste sú umiestnené senzory a GPS, ktoré ukladajú dáta. Preto vieme celkom presne koľko prejdú kilometrov a kedy, vieme v akom čase sa vyskytujú najväčšie zápchy a podobne. Na základe týchto dát, resp. jej interpretácie sme nielen na začiatku nastavili BUS pruhy, ale aj teraz pravidelne analyzujeme či táto zmena splnila svoj účel.

To znie veľmi jednoducho a aj logicky. Prečo to nerobia takto všetci?

Prijímať rozhodnutia na základe dát sa v krajinách za železnou oponou len rozvíja, a je aj na nás, aby sme ju propagovali a podporovali. Napríklad škandinávske krajiny, majú už spomínané sčítanie plne elektronické už od 80 rokov minulého storočia a v súčasnosti len čerpajú údaje z existujúcich registrov, v prípade verejnej dopravy sú tiež veľmi popredu. Verejné politiky by mali byť vykonávané na základe dát, a nie „z buka do buka, ako si zmyslí kapitán“. (smiech)

Čo ja osobne vidím ako problém vo všeobecnosti je neochota transparentne a racionálne využívať verejné zdroje a dilentantizmus. Na jednej strane je to obmedzená znalosť manažérov o potenciáli dát, na druhej strane to môžu byť rôzne súkromné ambície (hlavne vo verejnej správe) obohatiť sa na projektoch.

Neexistuje v tejto oblasti v súčasnosti žiadna legislatívna opora?

Prvou lastovičkou v tejto oblasti určite bolo, že sa vytvoril na ministerstve financií útvar hodnoty za peniaze, ktorý hodnotí vybrané štátnej projekty. No dodržiavanie odporúčaní od týchto expertov štátnymi manažérmi radšej spomínať nebudem.

Druhou, mierne odlišnou vecou, ktorá mi napadá je, že niekedy v októbri minulého roka sa dostal do MPK nový zákon o údajoch, ktorý je vlastne prvý zákon, ktorý komplexne rieši údaje ako také, a zaväzuje vlastníkov údajoch alebo registrov aby zdokonaľovali kvalitu svojich registrov. Je to však aj otázka peňazí, nakoľko dátoví analytici sú dobre platení v súkromnej sfére a štát by mal viac motivovať týchto ľudí aby pracovali pre štát.

V tomto zákone sú upravené aj analytické jednotky a pochválim sa, že ako jediné slovenské mesto je tam pilotne zaradená aj Bratislava. Keďže sme v zákone uvedený ako analytická jednotka tak vieme žiadať o údaje od iného orgánu verejnej moci a musí nám ich poskytnúť. Následne vieme lepšie a adresnejšie nastavovať verejné politiky mesta.

Čo by ste na záver odkázali našim čitateľom a čitateľkám?

Rozumieť dátam je bohatstvom s nevyčísliteľnou hodnotou. Dáta na rozdiel od zlata netreba hľadať a ryžovať v ťažkých prírodných podmienkach. Ich úložiská sú všade okolo nás, treba si len správne vybrať.

Rozhodnutia opreté o kvalitné dáta sú rozhodnutia verifikované skúsenosťou a ľudským umom. Preto je rozhodovanie na základe dát cestou ako zodpovednejšie, profesionálnejšie a bez zbytočného spochybňovania meniť  spoločnosť k lepšiemu.

Ďakujeme, že si nám priblížil svet dát a držíme palce v ďalšom bádaní! Veríme, že sa aj nabudúce prídeš s nami podeliť o zaujímavé novinky a možno aj o tom, že prečo sme spoločne založili OZ Klebe(da)ta.

Inštitút dátových politík

Teraz najčítanejšie

Inštitút dátových politík

Inštitút dátových politík (IDP) je nezávislý analytický inštitút, ktorého cieľom je na základe dát poskytovať objektívne informácie a odporúčania. Blogy a komentáre prezentujú názory autorov a Inštitútu dátových politík (IDP), ktoré nemusia nutne odzrkadľovať oficiálne názory ich zamestnávateľov.