Denník N

Koľko nás stojí nekompetentnosť v kultúre?

Slovenská národná knižnica v Martine uzavrela 4. apríla 2014 nepotrebnú realizačnú zmluvu na sumu 5 249 361 €. Kompletná digitalizácia jednej novinovej strany vrátane automatickej segmentácie strany stojí štandardne 0,15 €.  Ale SNK podľa zmluvy zaplatila 5,7 €.

Bývalý minister kultúry Marek Maďarič  dňa 10. 02. 2013 povedal, že informoval organizácie o platnosti zmluvy (podpísanej s konzorciom TMG na 170 miliónov eur) a o možnosti jej využitia. „Od nich záleží, aké dohodnú podmienky realizácie, prípadne či uzavrú nejaké realizačné zmluvy s týmto konzorciom. Nijako na nich netlačím, je na nich, či to využijú,“ (HNonline) uviedol s tým, že rešpektuje, ako je v národných projektoch stanovený pomer digitalizácie vo vnútri samotných organizácií oproti dodávkam z externého prostredia.

(Automatická segmentácia novinovej strany)

Za využitie alebo nevyužitie rámcovej zmluvy s TMG zodpovedali štatutári organizácií (knižnice, múzea, galérie a pod.). Niektoré národné projekty digitalizácie v rámci programu informatizácie OPIS2 priamo počítali s tým, že využijú rámcovú zmluvu. Preto podpísali realizačné zmluvy.

Ale v projekteDigitálna knižnica a digitálny archív, ktorý mala na starosti Slovenská národná knižnica v Martine sa nikdy so žiadnou externou službou nepočítalo. Knižnica mala na realizáciu dostatok prostriedkov (takmer 50 miliónov eur) a všetky aktivity mala urobiť dostatočnými vlastnými silami a prostriedkami.

Napriek tomu Slovenská národná knižnica (SNK) podpísala dňa 4. apríla 2014 realizačnú zmluvu so spoločnosťou TMG (Realizačná zmluva č. SNK 0216/2014/SaP Doplnená) na 5 249 361,60 €. Predmet zmluvy nevychádzal z projektu a zmluva nebola vôbec potrebná. Takto SNK neoprávnene minula vyše 5 miliónov eur na nepotrebnú aktivitu.

Predmetom zmluvy je niečo, čo knižnica nazýva „rozčlánkovanie“ novinových strán na články. V podstate ide o tzv. segmentáciu novinovej strany, ktorú vykonáva automaticky softvér. Preto žiadna zmluva nebola potrebná. Automatická segmentácia jednotlivých čísel a strán novín je pre používateľov digitálnych služieb celkom dostatočná. Okrem iného aj preto, že používateľ vidí novinovú stránku tak, ako bola pôvodne vytlačená a nie len jeden vybratý článok zo strany.

Prebieha to zhruba takto: dokument sa skenuje, potom sa naskenovaný obraz upraví, upravený obraz ide do systému optického rozlišovania písma (OCR). V tomto procese prebieha aj automatická segmentácia vylepšená softvérom CCS (DocWorks), ktorý SNK vlastní ale nepoužila ho. Namiesto toho to robila externe!  OCR je rozobratie textu na písmenká, čo znamená, že v texte sa potom dá vyhľadávať, dá sa upravovať a pod. V tomto istom procese sa vykonáva automaticky aj tá segmentácia, ako to ukazuje obrázok v tomto blogu.

V podstate ide o činnosť, ktorú automaticky robí softvér, ktorý má aj Slovenská národná knižnica. Softvér automaticky ohraničí segmenty, označuje umiestnenie a veľkosť elementu a farebné odlíšenie vyjadruje klasifikáciu elementov (žltá=text; modrá=titulky; zelená=reklamy; tmavozelená=ilustrácie).

Rozoberanie novinovej strany na jednotlivé samostatné články nemá, samozrejme, žiadny odborný ani používateľský zmysel a už dávno sa považuje za prekonané. Žiadna krajina na svete nepovažuje jednotlivý novinový článok za objekt digitalizácie. Ale, Slovenská národná knižnica vykázala v projekte samostatnénovinové články ako objekty, čo považujem za podstatnú zmenu projektu a podvodvo vykazovaní.

SNK si svojvoľne vysvetľuje projekt. V ňom sa spomína, že objektom môže byť aj objekt, napríklad odborný alebo vedecký článok, ktorý má vlastnú identifikáciu (tzv SICI), čo však žiadny novinový článok nemá a ani nemôže mať!

Teraz Vám poviem, v čom je podstata nekompetentného podvodného konaniazo strany SNK. Je to len pár faktov:

V realizačnej zmluve 4. apríla 2014 (Realizačná zmluva č. SNK 0216/2014/SaP Doplnená) SNK dohodla, že za 5 249 361 € sa „rozčlánkuje“ maximálne vyše 5 520 000 strán.

Lenže pozor! V zmluve SNK dohodla, že bude platiť za normalizované strany formátu A4 (čiže 1800 znakov), nie novinové strany!

Jedna novinová strana má však priemerne 6 normalizovaných strán A4. Takže 5 520 000 strán, to nie sú novinové strany, ale strany formátu A4 (1800 znakov).

Čiže keď 5 520 000 strán formátu A4 vydelíme šiestimi, zistíme, že de facto ide o „rozčlánkovanie“ čiže segmentáciu 920 000 novinových strán. (To mala byť asi týždenná produkcia v digitalizačnom centre SNK vo Vrútkach).

Za toto „rozčlánkovanie“ podľa zmluvy išlo 5 249 361 €. Stačí si pozrieť faktúry na stránke SNK, podľa ktorých SNK mesačne vyplácala v roku 2014-2015 mesačne 400 000-500 000 tisíc eur….!

Teraz už len stačí vydeliť 5 249 361 € počtom 920 000 novinových strán. Zistíme, že rozčlánkovanie jednej novinovej strany stálo 5,7 €.Pritom štandardná cena za kompletnú digitalizáciu jednej strany vrátane automatického „rozčlánkovania“ (segmentácie) je 0,15 €.

Čo na to hovorí ministerstvo kultúry?

Text je súčasťou blogov Denníka N, nie je redakčným obsahom.
Administrátorov blogov môžete kontaktovať na adrese blog@dennikn.sk.

Teraz najčítanejšie

prof. PhDr. Dušan Katuščák, PhD.

Dušan Katuščák

Bibliograf, knihovník, vysokoškolský profesor. V r. 2000-2012 generálny riaditeľ Slovenskej národnej knižnice v Martine. V národnej knižnici pracoval od roku 1968. Oblasti profesionálneho záujmu: bibliografia, knižničná veda, štandardizácia, digitalizácia, informačná politika, informatizácia knižníc, dokumentácia kultúrneho dedičstva, ochrana písomného dedičstva. Autor vyše 200 odborných a popularizačných publikácií a viacerých národných projektov.