Centralne Repozytorium Informacji Publicznej
Nowy tryb udostępniania i ponownego
wykorzystywania informacji publicznej.
dr Alek Tarkowski
Czym jest idea otwartego rządu?
• Reforma modelu rządzenia i współpracy
paostwa z obywatelami
• Zainspirowana komunikacją i współpracą
sieciową
• Wykorzystująca technologie cyfrowe
• Przedefiniowanie idei e-usługi – tak jak jest
ona rozumiana w modelu e-administracji (e-
gov)
Kontekst: 4 przemiany
• technologiczna: internet
• demograficzna: pokolenie cyfrowe
• demokracja: od reprezentacji do
partycypacji
• administracja: w poszukiwaniu większej
efektywności
Otwarty rząd na świecie
• Od 2009 intensywnie wdrażany w USA, UK,
Australii
• Repozytoria i katalogii otwartych danych – m.in.
Nowa Zelandia, Grecja, Mołdawia, Estonia,
Norwegia; Londyn, Nowy Jork, Paryż
• Otwarty rząd szczególnie ważny na poziomie
lokalnym.
• Unia Europejska:
– Deklaracja z Visby (2009)
– Europejska Agenda Cyfrowa (2010)
Wdrażanie otwartego rządu w Polsce
• W ostatnich latach podjęto szereg ważnych
działao (m.in. reforma konsultacji, dostęp do
informacji publicznej)
• Kluczowe bariery:
– niski poziom informatyzacji administracji
– niewystarczające wykorzystanie BIPów
– problemy z dostępem do informacji publ.
– nieprzejrzysty proces stanowienia prawa
– wadliwy proces konsultacji
Gdzie jesteśmy
• Reforma zasad dostępu do informacji publicznej i
wprowadzenie reguł jej ponownego
wykorzystania
• Tryb repozytoryjny dostępu i ponownego
wykorzystania jako krok w stronę otwartych
danych
• Reforma systemu BIP
• Prace nad ustawą o otwartych zasobach
publicznych
• Reforma procesu konsultacji (MG, RCL)
• Działania organizacji pozarządowych
Rola rozwojowa zasobów sieciowych
Rozwój Polski cyfrowej opiera się na trzech filarach:
infrastrukturze (potencjał), kompetencjach
użytkowników (popyt) i dostępności zasobów – usług
i treści
Dotychczasowe działania skupiają się na rozwoju
infrastruktury, kosztem dwóch pozostałych filarów
Wspieranie rozwoju zasobów: regulacja przyjazna
dostawcom zasób i usług online; oraz udostępnianie
własnych zasobów przez instytucje publiczne
Otwartośd zasobów publicznych
Internet i technologie cyfrowe, poprzez redukcję kosztów
przechowywania i udostępniania zasobów, umożliwiają
powszechną dostępnośd zasobów publicznych
Funkcja prorozwojowa: powszechnie dostępne zasoby, np.
dane publiczne (np. meteorologiczne, geodane, statystyczne)
jako podstawa innowacyjnych usług (komercyjnych i
niekomercyjnych), w skali kraju – ale także na poziomie
miejskim
Funkcja wyrównywania szans edukacyjnych i uczestnictwa w
kulturze, poprzez dostęp do zasobów w Sieci
Otwartośd zasobów publicznych –
wdrażanie idei
Tryb udostępniania pełnych zbiorów danych publicznych, jako
informacji publicznej o szczególnym znaczeniu
prorozwojowym i pro-innowacyjnym, wpisany do ustawy o
dostępie do informacji publicznej
Także otwarty model udostępniania wszelkiej informacji
do ponownego wykorzystania
Trwają prace nad założeniami ustawy o otwartości zasobów
publicznych – dostępnośd zasobów edukacyjnych, naukowych
i kulturowych
Zasady dostępu i wykorzystania oparte na modelach
wypracowanych w ramach regulacji dostępu i ponownego
wykorzystania informacji publicznej
Jakie szanse dają dane publiczne?
• Rozliczalnośd administracji
• Wzrost jakości usług publicznych poprzez
możliwośd ich porównywania i wyboru na tej
podstawie
• Ocena wydajności instytucji publicznych
• Rozwój zindywidualizowanych usług
społecznych
• Platforma debaty społecznej
• Wzrost ekonomiczny
Kontekst europejski
• 2009: deklaracja ministerialną z Malmö w sprawie
administracji elektronicznej, w której zaleca się poprawę
warunków dostępu i ponownego wykorzystania informacji i
danych sektora publicznego.
• 2010: Cyfrowa Agenda dla Europy 2010‒2015 potwierdza
znaczenie otwartości zasobów publicznych.
• Raport Uncharted Waters. The State of Open Data in Europe:
oficjalne inicjatywy związane z otwartością danych
realizowane w 11 paostwach członkowskich Unii Europejskiej
(Niemcy, Francja, Hiszpania, Włochy, Holandia, Wielka
Brytania, Finlandia, Dania, Norwegia, Grecja oraz Estonia).
Inicjatywy oddolne inicjowane w 21 paostwach.
Wartośd zasobów informacyjnych
• „Measuring European Public Sector Information Resources”
(MEPSIR), 2006: wartośd rynku ponownego wykorzystania
informacji publicznej: 27 miliardów euro rocznie
• Porównanie modelu otwartego (USA) i zamkniętego (EU) –
„Commercial exploitation of Europe’s public sector
information”, 2000: 7-krotny zysk w Europie, 39-krotny w USA
• The Commercial Use of Public Information (CUPI), 2006, UK:
wartośd rynku wykorzystującego zasoby publiczne, mogłaby
zostad podwojona, gdyby zredukowad straty związane ze zbyt
wysokimi kosztami licencyjnymi, ograniczeniami konkurencji
oraz brakiem dostępnych informacji
Przykład: data.gov
• Scentralizowane narzędzie opisujące zasoby publiczne, w połączeniu z
odpowiednią strategią instytucjonalną, ma służyd zmianie ogólnej
praktyki zapewniania dostępności zasobów publicznych
• 2009: Open Government Directive - instytucje rządowe zobligowane do
udostępnienia trzech zbiorów danych o wysokiej wartości do 2010.
• Informacja wysokiej wartości: może byd wykorzystana w celu zwiększenia
odpowiedzialności instytucji, zwiększenia świadomości publicznej działao
instytucji, wspierania misji instytucji, stworzenia okazji gospodarczych lub
zareagowania na potrzeby zidentyfikowane w ramach konsultacji.
• W chwili obecnej w data.gov: ponad 3000 zbiorów danych (z czego około
2000 to dane wysokiej jakości), 930 narzędzi, 376 tysięcy zbiorów
geodanych
Przykład: data.gov
• „Government Data and the Invisible Hand”:
• rząd, mając na celu wzrost przejrzystości swoich działań, powinien
redukować swoją rolę jako podmiotu przedstawiającego informacje
obywatelom - zadaniem jest dostarczanie surowych danych
• na ich podstawie inne podmioty będą tworzyć serwisy
wykorzystywane przez obywateli ‒ wykorzystanie otwartych
standardów umożliwi odpowiedni poziom konkurencji w ich
tworzeniu.
• zacofanie administracji publicznej w wykorzystywaniu technologii
cyfrowych, widoczne w porównaniu z podmiotami komercyjnymi.
• konieczność sprostania wymogom administracyjnym znacząco
ogranicza innowacyjność,
• Podmioty rynkowe lub indywidualni programiści potrafią tworzyć
projekty o budżetach znacząco mniejszych
Idea repozytorium
• Instytucja „repozytorium” - nowy tryb udostępniania
informacji publicznej i jej ponownego wykorzystywania.
• Pojęcie „zasobu informacyjnego”, tj. szczególnego rodzaju
informacji publicznych (o wyjątkowym znaczeniu dla rozwoju
innowacyjności w kraju), który obejmuje zbiory danych
surowych oraz inne informacje publiczne posiadane przez
podmioty wykonujące zadania publiczne.
• Kryterium umieszczenia zasobu w repozytorium jest jego
szczególna przydatnośd dla tworzenia na jego podstawie
wartości dodanej.
Mechanizm funkcjonowania
• Wyznaczone podmioty publicznoprawne przekazują określone
przez Premiera zasoby informacyjne do repozytorium (lub
wskazują ich położenie we własnym repozytorium)
• Zasoby opracowane w celu spełnienia wymogów
przewidzianych dla zasobu.
• Obowiązek obejmuje zarówno jednorazowe przeniesienie jak I
cykliczne uzupełnianie repozytorium
• Kompetencją ministra właściwego do spraw informatyzacji
jest weryfikacja poprawności przekazywanych informacji, a
następnie organizacja ich przetwarzania w repozytorium (w
tym udostępniania zasobu podmiotom zainteresowanym).
Zasoby informacyjne
• Raport „Open data, Open society”: geodane, dane
demograficzne, wyniki wyborów, dane o produkcji i zużyciu
energii, budżetowe i podatkowe, o działalności gospodarczej,
o ochronie i zanieczyszczeniu środowiska, zdrowotne, prawne,
edukacyjne.
• Raport „Measuring European Public Sector Information
Resources”: informacje biznesowe, informacje geograficzne,
informacje prawne, informacje meteorologiczne, informacje
transportowe.
• MSWiA, „Wizja rozwoju ePUAP”: dane biznesowe, dane
geograficzne, dane prawne, dane meteorologiczne, dane
statystyczne, dane transportowe.
Zasoby informacyjne c.d.
• Szereg zasobów już dziś jest dostępny w postaci dobrze
skonstruowanych, ustrukturyzowanych baz danych: wybrane
zasobach statystyki publicznej, dane o budżecie paostwa,
dane budżetowe JST udostępniane w systemie BESTIA oraz
dane Paostwowej Komisji Wyborczej.
• Zasoby udostępniane w drugiej kolejności, po dokonaniu
audytu, powinny objąd m.in. meteorologiczne bazy danych,
ewidencje badao klinicznych oraz dane Systemu Informacji
Oświatowej.
Architektura repozytorium
• System repozytoriów jako jednolity punkt dostępu do
zasobów informacyjnych - oparty na modelu procesowym
dostępu do zasobów publicznych (analogicznie jak platforma
ePUAP).
• Rozwiązanie to abstrahuje od miejsca składowania informacji
publicznej.
• Połączenie centralnego repozytorium utrzymywanego dla
wielu podmiotów (rozwiązanie dla podmiotów nie mających
własnego repozytorium) oraz repozytoriów utrzymywanych
przez poszczególne instytucje
• Z punktu widzenia użytkownika koocowego będzie istnied
tylko jeden, centralny punkt dostępu do zasobów.
Centralne repozytorium a BIP
• BIP: rozproszony charakter, nieskoordynowany system
udostępniania danych – w szczególności róźnorodnośd
formatów, brak standardów zapewniających dostępnośd i
wyszukiwalnośd informacji, oraz silosowy (resortowy /
instytucjonalny) charakter
• centralne repozytorium zapewnia możliwośd agregowania i
udostępniania danych surowych w formacie umożliwiającym
ich odczyt maszynowy
• Znikome prawdopodobieostwo duplikowania informacji w BIP
i repozytorium pod warunkiem zgodności BIP ze standardami
systemu repozytoryjnego – dzięki możliwości agregacji
rozproszonych danych poprzez odnośniki
Standardy danych
“Prezes Rady Ministrów określa każdorazowo, w drodze
rozporządzenia: zasób informacyjny przeznaczony do
umieszczenia w centralnym repozytorium, wraz ze
wskazaniem podmiotu obowiązanego do jego przekazania *…+
oraz wymagania techniczne opracowania tego zasobu, który
ze względu na sposób koordynacji informacji oraz związane z
nim metainformacje gwarantuje aktualnośd informacji,
przeszukiwalnośd i dostępnośd zasobu oraz możliwośd jak
najszerszego ponownego wykorzystywania informacji
publicznych i ich maszynowego odczytu.”
Standardy danych c.d.
1. Troska o kompletnośd danych. Dane publiczne powinny byd
udostępnione w całości. Zbiory danych powinny byd
uzupełnione o metadane.
2. Udostępnianie danych podstawowych. Należy udostępniad
dane zebrane w postaci jak najbardziej źródłowej i w jak
największej rozdzielczości.
3. Udostępnianie danych bieżących. Dane publiczne powinny
byd udostępniane jak najprędzej, by zapewnid ich jak
największą wartośd.
4. Zapewnienie dostępności danych. Zasoby powinny byd
dostępne dla jak największego zakresu użytkowników, do jak
najszerszych celów.
Standardy danych c.d.
5. Umożliwienie przetwarzania maszynowego.
6. Dostęp do danych bez dyskryminacji. Dane powinny byd
dostępne dla wszystkich, anonimowo, bez konieczności
rejestracji lub weryfikacji tożsamości.
7. Stosowanie niezastrzeżonych formatów. Dane powinny byd
dostępne w formatach plików umożliwiających swobodne ich
wykorzystanie.
8. Udostępnianie danych bez zbędnych licencji. Dane publiczne,
o ile to możliwe, nie powinny byd przedmiotem praw
autorskich, patentów, nie byd znakami towarowymi czy
podlegad ochronie tajemnicy przedsiębiorcy
Standardy danych c.d.
9. Trwałośd danych. Dane publiczne powinny byd wieczyście
archiwizowane, by zapewnid ciągłą do ich dostępnośd.
10. Zapewnienie możliwości wyszukiwania danych. Zbiory
danych powinny byd katalogowane na bieżąco oraz
umożliwiad indeksowanie przez wyszukiwarki sieciowe
Standardy danych c.d.
David Eaves: otwarte dane to takie zasoby,
które można znaleźć (dzięki stworzonym
możliwościom wyszukiwania ich w sieci),
bawić się nimi (dzięki możliwości
przetwarzania maszynowego) oraz
udostępniać innym (dzięki braku
ograniczeń prawnych).
Części składowe repozytorium
1. katalog danych (na wzor data.gov, data.gov.uk, itp.)
2. sfederowany system synchronizujący metadane
istniejących baz danych i katalogów baz danych
3. aplikacja/narzędzie umożliwiające korzystanie z danych
zebranych w katalogach
4. Baza danych na potrzeby tych instytucji, które nie
posiadają własnego repozytorium
Kontekst europejski c.d.
• DAE: przegląd Dyrektywy Re-use do 2012
• Wyłączenie nadawców, instytucji kultury /
edukacji / badawczych?
• Opłaty za wykorzystanie – czy na pewno
zwrot kosztów + rozsądny zwrot z
inwestycji jako pułap?
• DAE action 3: Open up public data resources
for re-use
• 2012: portal dostępowy do informacji z KE
• 2013: pan-europejskie repozytorium