4.1. Założenia modelu ODQM

 

Według słownika języka polskiego model to wzór, według którego „coś zostało lub zostanie wykonane”[1]. Model to także „system założeń, pojęć i zależności między nimi pozwalający opisać (modelować) w przybliżony sposób jakiś aspekt rzeczywistości”. Zatem zadaniem modelu jest udzielenie odpowiedzi jak należy wykonać czynności, aby osiągnąć założony cel. Model jest związany z obszarem merytorycznym dane obszaru i jest przez niego determinowany. W odróżnieniu od pojęcia modelu - metodyka, której domeną jest obszar: co należy zrobić, a nie jak, koncentruje się na metodach realizacji zadań abstrahując od merytorycznego kontekstu przedmiotowego obszaru.

Dla zachowania jednolitości stosowanego w modelu nazewnictwa istotne jest uściślenie i zdefiniowanie pojęć, które będą miały kluczowy wpływ na funkcjonowanie i rezultat stosowania modelu. Dlatego w oparciu o przeprowadzone w poprzednich rozdziałach badania literaturowe, na potrzeby budowy modelu oceny jakości informacji publicznej należy w pierwszej kolejności zdefiniować te pojęcia. Zatem informacją publiczną na potrzeby ponownego użycia, będzie informacja publiczna dostępna jakąkolwiek metodą transmisji danych w katalogach zbiorów danych lub informacji o katalogach zbiorów danych, na portalach open data i dodatkowo w serwisach BIP (dla Polski).

Pojęcie modelu informacji publicznej na potrzebę ponownego użycia będzie stosowane w formie skróconej jako: model lub model pomiaru jakości oraz poprzez akronim ODQM[2].

Jak wykazały badanie literaturowe przeprowadzone w poprzednich rozdziałach pracy do budowy modelu oceny jakości  informacji publicznej do ponownego użycia konieczne jest doświadczenie i odpowiednia wiedza specjalistyczna między innymi z obszarów ekonomiczno – społecznych uwarunkowań związanych z ewolucją i warunkami dostępności i ponownego użycia informacji publicznej, teorii informacji, informatyki oraz kwalitologii.

Podstawowym celem konstrukcji modelu pomiaru jakości informacji publicznej na potrzeby ponownego użycia jest wspomaganie procesu oceny jakości informacji, co docelowo umożliwiałoby jego przeprowadzanie przez osoby, które nie są biegłe we wszystkich wymienionych i powiązanych obszarach, a koniecznych do jego przeprowadzenia. Docelowe zastosowanie modelu w formie algorytmu wbudowanego w oprogramowanie portali oraz bramek agregujących automatyczną wymianę informacji publicznej między portalami lub tematycznymi portalami open data, pozwoli na ocenę i nieodstępny dotąd organizacyjnie i ekonomicznie (efektywność ekonomiczna) przepływ i agregację informacji publicznej w celu jej dalszego przetwarzania na potrzeby ponownego użycia.

Algorytm modelu docelowo może być odzwierciedlony w dowolnym języku programowania ze szczególną uwagą na zapewnienie wymiany danych przez Internet. Dzięki jego zastosowaniu możliwe byłoby automatyczne generowanie rankingów informacji, udostępnianych w ramach portali open data, z wynikami, które mogłyby być transponowane do postaci inteligentnych infografik.

Dla użytkowników takiego rozwiązania model może prezentować wyniki asymetrycznie – tylko do odczytu. Ze względu na permanentny rozwój technik komunikacji i wymiany danych w Internecie model powinien być aktualizowany. Dlatego zapewnienie w interfejsie informatycznym, dla użytkowników zaawansowanych, możliwości edycji parametrów modelu, czyli uzupełniania i aktualizacji, pozwoli ewoluować poprzez dostosowanie do pracy w oparciu o nowe, nieznane obecnie technologie komunikacyjne i informatyczne.  Idea stosowania modelu została przedstawiona na poniższym rysunku:

Rysunek 1 Schemat stosowania modelu pomiaru jakości informacji publicznej. Źródło: Opracowanie własne.

Wynikiem pomiaru jakości informacji publicznej na potrzeby ponownego użycia, będzie wyznaczenie dyskretnych wartości, umożliwiających porównanie jakości zbiorów informacji i w rezultacie całych zasobów portali open data. Model może funkcjonować jako zewnętrzne repozytorium metadanych modelu wraz z obsługą i autoryzacją wersjonowania modelu oraz dostarczające usługę pomiaru w modelu PaaS[3] lub jako element MaaS[4].

 

W celu budowy modelu pomiaru jakości informacji publicznej do ponownego użycia zastosowanie znajdą:

·       Badanie literaturowe w celu selekcji cech informacji do pomiaru jej jakości

·       Metody kwalitologiczne[5] w celu definicji atrybutów jakości i ich mierników

·       Metoda pomiaru jakości informacji w ujęciu infologicznym zaproponowana przez B. Stefanowicza[6]

·       Pięciogwiazdkowy model danych połączonych Bernersa - Lee[7]

·       Do budowy, dokumentacji i utrzymania jakości modelu w czasie zastosowane zostały wybrane aspekty metodyki metodyki SCRUM[8] wraz z językiem UML[9], metodyki ITIL v. 3.0[10], oraz modelowanie komputerowe.

 

4.2. Struktura funkcjonalna modelu

 

Do przedstawienia logiki opisu modelu, które zobrazuje jego działanie zastosowano język UML (ang. Unified Modeling Language). Język UML zawiera wiele definicji diagramów opisujących strukturę i dynamikę, które mogą być stosowane w niniejszej pracy. Szczególnie ważne będą przypadki użycia jako część metodyki zarządzania projektami PRINCE II oraz diagramy przypadków użycia. Zostaną one wykorzystane w dalszej części pracy do opisu funkcjonalnego modelu jako scenariusza algorytmu.

Zestawienie kolejnych podejmowanych czynności w strukturze modelu zostało przedstawione na poniższym diagramie w notacji języka UML 2.0[11].

 

 

Rysunek 2 Struktura funkcjonalna modelu – ODQM – pomiaru jakości informacji publicznej na potrzeby ponownego użycia. Źródło: opracowanie własne.

 

4.3. Definicja klas i cech oceny jakości

 

Na podstawie badań literaturowych przeprowadzonych w części trzeciej niniejszej pracy zdefiniowano pięć klas jakości[12], uszeregowanych w stopniu od 1 do 5, gdzie stopień pierwszy – jest stopniem najniższym, natomiast piąta klasa jakości, określa najwyższy poziom jakości informacji publicznej do ponownego użycia.

 

Opis charakterystyki poszczególnych klas zawiera poniższa tabela.

 

Tabela 1 Klasy jakości informacji publicznej do ponownego użycia. Źródło Opracowane na podstawie 5 star model autorstwa Tima Berners’a-Lee http://www.w3.org/DesignIssues/LinkedData.html [Dostęp 15.05.2015]

Nr klasy

Oznaczenie graficzne

Charakterystyka klasy jakości informacji publicznej do ponownego użycia

Dodatkowe objaśnienia

1

Informacja jest dostępna na stronie internetowej w dowolnym formacie. Informacja jest na licencji otwartej.

Ale dopuszczalne jest publikowanie informacji w formie np. obrazów z danymi i tekstem.

2

★★

Informacja spełnia wymogi klasy pierwszej oraz jest dostępna w formie ustrukturyzowanej w formacie umożliwiającym odczyt.

Np. informacja jest publikowana w formacie programu Excel zamiast skanu tabeli z danymi.

3

★★★

Informacja spełnia wymogi klasy drugiej oraz jest zapisana w formacie otwartym.

Informacja zamiast w Excelu jest publikowana w formacie tekstowym np. csv.

4

★★★★

Informacja spełnia wymogi klasy trzeciej oraz jest zapisana w postaci otwartych standardów W3C pozwalających identyfikować i rozbudowywać obraz struktury semantycznej

Informacja jest publikowana w formacie opisującym jej semantykę rdf i SPARQL zamiast csv.

5

★★★★★

Informacja spełnia wymogi klasy czwartej oraz zapewnia kontekst, gdyż jest połączona z zewnętrznymi danymi.

Informacja zawiera połączenia strukturalne online do innych zbiorów informacji.

 

Następnie do każdej klasy przypisywane są cechy jakości informacji, które będą podlegać ocenie. Cechy te zostały wybrane w oparciu o analizę przeprowadzoną w poprzednim rozdziale. Cechy utworzyły grupę, opartą na zestawieniu Epplera[13], najpełniej odpowiadającemu przedmiotowej charakterystyce. Następnie wykonywany jest przegląd kryteriów oraz ich charakterystyka pozwalająca na usunięcie kryteriów nadmiarowych. Aby zminimalizować przytaczane w literaturze przedmiotu zagrożenie związane z potencjalną luką miedzy założonymi kryteriami, a zrozumianymi przez użytkownika modelu, przegląd kryteriów oceny jakości ma tez na celu jednoznaczne sprecyzowanie ich znaczenia w celu zminimalizowania możliwości wystąpienia luki związanej z percepcją użytkownika.

Z grupy kryteriów proponowanych przez Epplera z wyeliminowane zostały kryteria niepodlegające ocenie[14], zależne w głównej mierze od stanu w jakim znajduje się użytkownik i jego percepcji (kryteria subiektywne). Następnie wyodrębnione zostały poniższe kryteria podlegające ocenie uporządkowane według liczebności postulowanej przez różnych autorów, dokonanej podczas analizy literatury[15]. W kolejnym kroku, na potrzeby zastosowania w modelu cechy te zostały sprecyzowane opisami. Przedstawia je poniższa tabela.

 

Tabela 2 Cechy jakości informacji. Oprac. własne na podstawie Eppler, J. M., Managing information quality: Increasing the value of information in knowledge-intensive products and processes, Springer Science & Business Media, 2006

Cecha jakości informacji

Charakterystyka cechy

dostępność

Dostępność do informacji w chwili zapotrzebowania

aktualność

Informacja zawiera aktualne informacje, i, lub metadane charakteryzują informację jako aktualną

użyteczność

Informacja jest na tyle odpowiednia dla odbiorcy, że można ją wykorzystać

kompletność

Zakres informacji jest adekwatny do problemu.

dokładność

Informacja jest wystarczająco precyzyjna i zbieżna ze stanem rzeczywistym

terminowość

Informacja przetwarzana jest i dostarczana odpowiednio szybko

identyfikowalność/wiarygodność

Autor (publikujący i wytwarzający) informację jest określony i budzi zaufanie

zgodność

Informacja nie jest sprzeczna i, lub jest zgodna z konwencją

wygoda

Informacja odpowiada potrzebom i zwyczajom odbiorcy

interaktywność

Treść informacji może być dostosowywana interaktywnie

bezpieczeństwo

Dostęp do nieautoryzowanego dostępu do informacji jest zabezpieczony adekwatnie do potrzeb

utrzymywalność

Możliwość aktualizacji i dostosowywania informacji

szybkość

Infrastruktura dostosowuje się do liczby użytkowników i obciążenia zadaniami

jasność

Informacja jest zrozumiała dla odbiorcy.

zwięzłość

Informacja nie jest redundantna w stosunku do celu jej przetwarzania.

poprawność

Informacja jest pozbawiona błędów i zakłóceń.

 

Następnie przypisano cechy do poszczególnych klas. Zestawienie w ujęciu poszczególnych klas prezentuje poniższa tabela. Wystąpienie pomiaru cechy w danej klasie oznaczone jest przez znak „+. Cecha która występuje w niższej klasie jest obecna także w wyższych. Gdy oceniane są dodatkowe aspekty danej cechy w klasie wyższej, poniższa tabela odwzorowuje to poprzez kolejny znak + dla danej cechy w klasie wyższej.

 

Tabela 3 Cechy jakości uwzględnione w poszczególnych klasach jakości w modelu oceny jakości informacji publicznej do ponownego użycia. Źródło: opracowanie własne.

Cecha jakości informacji/klasa

★★

★★★

★★★★

★★★★★

dostępność

+

 

 

 

 

aktualność

+

 

 

+

+

użyteczność

+

 

 

+

+

terminowość

+

 

 

+

+

identyfikowalność/wiarygodność[16]

+

 

 

 

+

zgodność

+

+

+

+

+

wygoda

+

 

 

 

+

interaktywność

 

+

 

 

 

bezpieczeństwo

+

 

 

 

+

utrzymywalność

 

 

 

+

+

szybkość

 

 

 

 

+

 

Kolejnym krokiem w modelu oceny jest przypisanie w każdej klasie poszczególnym cechom mierników jakości. Mierniki jakości mają szczególne odniesienie do dziedzinowych właściwości związanych z ponownym użyciem informacji publicznej. Odnoszą się do specyfiki związanej z uwarunkowaniami prawno – społecznymi oraz technologicznymi związanymi z ponownym wykorzystaniem informacji publicznej. Poniżej przedstawiono zestawienie mierników oceny cech jakości informacji. Zestawienie to jest elementem definicji kryteriów oceny jakości informacji publicznej do ponownego użycia i dla zachowania spójności ocen różnych źródeł informacji, (takich jak portale open data) powinno być używane w przedstawionym kształcie. Jednak kształt ten nie będzie odpowiedni w każdym przypadku, dlatego w kolejnych iteracjach stosowania modelu kryteria te mogą być dostosowane poprzez nową ocenę przeprowadzoną przez ekspertów, dostosowującą je do konkretnych zastosowań dziedzinowych badanej informacji. Dla zachowania rozróżnienia ocen modelem z oryginalnymi miernikami i zaktualizowanymi, należy stosować oznaczenia wersji metody. Sposób tworzenia oznaczeń wersji modelu opisano w dalszej treści rozdziału.

 



Tabela 4 Mierniki jakości informacji publicznej do ponownego użycia w podziale na klasy. Źródło: opracowanie własne.

Klasa pierwsza

Cechy jakości w klasie pierwszej

ID

Nazwa miernika

Charakterystyka miernika

Dodatkowe informacje na temat pomiaru

Jednostka miary

Krytyczność miary

dostępność

x11

Dostępność akumulowana

Jeśli mierzona jest w sposób cykliczny dostępność, w stałych ostępach czasu, co najmniej 1 raz na dobę.

 

Logiczna P/F

 

 

x12

Dostępność chwilowa

Jeśli mierzona to informacja dostępna jest co najmniej 24 razy na dobę (próbkowanie co 1 godziny).

 

Logiczna P/F

 

aktualność

x13

Aktualność obowiązywania

Informacja ma określoną datę ważności – do kiedy obowiązuje – i treść informacji jest aktualnie obowiązująca.

 

 

Weryfikacja  czy bieżąca data i godzina jest mniejsza lub równa od daty i godziny ważności obowiązywania informacji. Jeśli nie jest określona data ważności wtedy FALSE

Logiczna P/F

 

 

x14

Świeżość aktualizacji

Informacja powinna być aktualizowana cyklicznie i jest zaktualizowana.

Weryfikacja czy data i godzina ostatniej aktualizacji mieści się w przedziale między datą i godziną analizy minus liczba dni aktualizacji.

Logiczna P/F

 

użyteczność

x15

Odpowiednia licencja

Informacja może być przez odbiorcę wykorzystana.

 

Logiczna P/F

X

 

x16

Informacja na licencji open

Informacja jest na jednej z licencji typu open.

 

Logiczna P/F

X

 

x17

Nieograniczone ponowne użycie

Nie istnieją warunki regulaminowe ograniczające swobodę ponownego użycia informacji.

 

Logiczna P/F

 

terminowość

x18

Dostępność chwilowa ad hoc

Informacja jest dostępna w momencie badania

 

Logiczna P/F

X

identyfikowalność/wiarygodność

x19

Podmiot wytwarzający informację

Jest określone imię i nazwisko i/lub podmiot wytwarzający informację.

Weryfikacja czy jest określone podmiot i lub imię i nazwisko osoby odpowiedzialnej za wytworzenie informacji

Logiczna P/F

 

 

x110

Podmiot publikujący informację

Jest określone imię i nazwisko i/lub podmiot publikujący informację.

Weryfikacja czy jest określone podmiot i lub imię i nazwisko osoby odpowiedzialnej za publikację informacji

Logiczna P/F

 

zgodność

x111

Określony format danych

Określony jest format danych w jakim publikowana jest informacja.

Weryfikacja deklaracji przynależności struktury informacji lub zbioru informacji do określonego w TABLICA_FORMATÓW_1 formatu danych.

Logiczna P/F

 

wygoda

x112

Ergonomia publikacji informacji

Interfejsy udostępniania informacji uwzględniają zdefiniowany standard.

Weryfikacja deklaracji zgodności z WCAG 2.0

Logiczna P/F

 

bezpieczeństwo

x113

Zabezpieczenie przed modyfikacją

Informacja jest chroniona przed nieautoryzowaną modyfikacją

Informacja może być dodatkowo transmitowana w protokole SSL.

Logiczna P/F

X

Klasa druga

Cechy jakości w klasie pierwszej

ID

Nazwa miernika

Charakterystyka miernika

Dodatkowe informacje na temat pomiaru

Jednostka miary

Krytyczność miary

zgodność

x21

Format informacji

Informacja publikowana jest w jednym z formatów umożliwiającym odczyt edycję z TABLICA_FORMATÓW_2

Weryfikacja formatu danych oraz przypisanie oceny w zależności od użytego formatu wg. gradacji TABLICA_FORMATÓW_2

Logiczna P/F

X

interaktywność

x22

Edytowalność informacji

Informacja publikowana jest w jednym z formatów umożliwiających edycję.

Np. czy mimo publikacji informacji w excel zamiast jako skan, czy excel nie jest zabezpieczony przed edycją, odczytem

Logiczna P/F

 

Klasa trzecia

Cechy jakości w klasie pierwszej

ID

Nazwa miernika

Charakterystyka miernika

Dodatkowe informacje na temat pomiaru

Jednostka miary

Krytyczność miary

zgodność

x31

Format danych

Informacja publikowana jest w jednym z otwartych formatów danych określonych w TABLICA_FORMATÓW_3

 

Weryfikacja formatu danych oraz przypisanie oceny w zależności od użytego formatu wg. gradacji TABLICA_FORMATÓW_3

Logiczna P/F

X

 

 

Klasa czwarta

Cechy jakości w klasie pierwszej

ID

Nazwa miernika

Charakterystyka miernika

Dodatkowe informacje na temat pomiaru

Jednostka miary

Krytyczność miary

aktualność

x41

Aktualność obowiązywania informacji

Informacja ma określony okres ważności – do kiedy obowiązuje – i  treść informacja jest aktualnie obowiązująca.

 

 

Weryfikacja  czy bieżąca data jest mniejsza lub równa od daty ważności obowiązywania informacji.

Logiczna P/F

 

 

x42

Świeżość aktualizacji

Informacja powinna być aktualizowana cyklicznie to czy jest ona zaktualizowana.

Weryfikacja czy data i godzina ostatniej aktualizacji mieści się w przedziale między datą i godziną analizy minus liczba dni aktualizacji.

Logiczna P/F

 

użyteczność

x43

Licencja open

Informacja jest udostępniana na licencji typu open.

Weryfikacja rodzaju licencji. Licencja Zgodna z licencją open.

 

 

terminowość

x44

Dostępność chwilowa

Dostępność informacji ad hoc

Dostępność informacji w momencie badania

Logiczna P/F

X

zgodność

x45

Otwarty format

Informacja publikowana jest w jednym z otwartych formatów danych W3C pozwalających identyfikować i rozbudowywać strukturę semantyczną

Badany format zawarty w tablicy TABLICA_FORMATÓW_4

Logiczna P/F

X

utrzymywalność

x46

Wsteczna korekta informacji

Można wnioskować o korektę danych (przez usera przez api)

Udostępniony interfejs do korekty danych

Logiczna P/F

 

Klasa piąta

Cechy jakości w klasie pierwszej

ID

Nazwa miernika

Charakterystyka miernika

Dodatkowe informacje na temat pomiaru

Jednostka miary

Krytyczność miary

aktualność

x51

Aktualność obowiązywania

Informacje połączone mają określone daty ważności – do kiedy obowiązują – a treść informacji jest aktualnie obowiązująca.

 

 

Weryfikacja  czy bieżąca data jest mniejsza lub równa od daty ważności obowiązywania informacji, która przypada najwcześniej

Logiczna P/F

 

 

x52

Świeżość aktualizacji

Informacje połączone powinny być aktualizowane cyklicznie i są one zaktualizowane.

Weryfikacja  czy data i godzina  ostatniej aktualizacji każdej informacji połączone mieści się w przedziale między datą i godziną analizy minus liczba dni aktualizacji przypisana danej informacji połączonej.

Logiczna P/F

 

użyteczność

x53

Ograniczenia wykorzystania

Informacja może być przez odbiorcę wykorzystana bez ograniczeń.

Ograniczenia licencyjne lub regulaminowe ponownego użycia

Logiczna P/F

 

 

x54

Licencja typu open

Czy informacja jest na jednej z licencji typu open?

Licencja informacji zawarta w TABLICA_LICENCJI_OPEN

Logiczna P/F

X

terminowość

x55

Dostępność chwilowa

Informacja połączona kontekstem jest dostępna ad hoc w momencie analizy

Zbadanie stopnia dostępności chwilowej i przyporządkowanie oceny.

Logiczna P/F

X

identyfikowalność/wiarygodność

x56

Podmiot wytwarzający informację

Określone są imiona i nazwiska i/lub podmioty wytwarzające wszystkie informacje w kontekście badanej informacji.

Weryfikacja czy jest określone podmiot i lub imię i nazwisko osoby odpowiedzialnej za wytworzenie informacji

Logiczna P/F

 

 

x57

Podmiot publikujący informację

Określone są imiona i nazwiska i/lub podmioty publikujące wszystkie informacje w badanym kontekście.

Weryfikacja czy jest określone podmiot i lub imię i nazwisko osoby odpowiedzialnej za publikację informacji

Logiczna P/F

 

zgodność

x58

Informacje w pełni połączone

Informacja jest połączona z informacjami zewnętrznymi w pełni

Zasoby informacyjne zewn. znane użytkownikowi są połączone z badaną informacją w pełni

Logiczna P/F

 

 

x59

Informacja częściowo połączona

Informacja jest połączona z informacjami zewnętrznymi częściowo

Zasoby informacyjne zewn. znane użytkownikowi są połączone z badaną informacją częściowo

Logiczna P/F

X

 

x510

Informacja w pełnym kontekście

Informacja w pełni tworzy kontekst z informacjami zewnętrznymi.

Zasoby informacyjne zewn. znane użytkownikowi są połączone i tworzą kontekst z badaną informacją w pełni

Logiczna P/F

 

 

x511

Informacja w częściowym kontekście

Informacja tworzy częściowy kontekst z informacjami zewnętrznymi.

Zasoby informacyjne zewn. znane użytkownikowi są połączone z badaną informacją i tworzą kontekst częściowo

Logiczna P/F

X

wygoda

x512

Określony format danych

Format danych w jakim publikowana jest informacja jest określony.

Weryfikacja deklaracji przynależności struktury informacji lub zbioru informacji do określonego w TABLICA FORMATÓW_4 formatu danych.

Logiczna P/F

X

 

x513

Połączone informacje

Łączenie z informacjami zewnętrznymi jest standardowe (czy wykorzystano standardowe źródła)

Formaty standardowe określone w TABLICA_FORMATÓW_4

Logiczna P/F

 

bezpieczeństwo

x514

Bezpieczna transmisja

Dostępna jest bezpieczna transmisja danych.

Dostępny jest protokół https do transmisji informacji.

Logiczna P/F

 

utrzymywalność

x515

Mechanizm korekty

Można wnioskować o korektę danych (przez usera przez api)

Weryfikacja dostępności poleceń w API

Logiczna P/F

 

 

x516

Procedura korekty

Jest ustalona procedura wstecznej korekty danych przez api.

Weryfikacja dostępności procedury dla badanej informacji

Logiczna P/F

 

szybkość

x517

Infrastruktura statyczna

Informacja jest udostępniona w oparciu o statyczną infrastrukturę nieobsługującą czasowe zwiększone obciążenia. 

Weryfikacja informacji nt. infrastruktury sprzętowej i sieciowej

Logiczna P/F

 

 

x518

Skalowalność infrastruktury

Informacja jest udostępniona w oparciu o skalowalną automatycznie infrastrukturę obsługującą czasowe zwiększone obciążenia. 

Weryfikacja informacji nt. infrastruktury sprzętowej i sieciowej

Logiczna P/F

 

 

 

 


4.4. Protokół wejścia

 

Jak przedstawiono w powyższej tabeli, w modelu przyjęte zostały następujące zasady relacji między elementami go tworzącymi. Występuje pięć klas oceny. Każda klasa zawiera cechy, w relacji wiele do wielu. Oznacza to, że różne klasy mogą być określane przez wiele cech oraz, że cecha może przynależeć do wielu klas. Natomiast na jednym poziomie jakości, czyli w jednej klasie występuje wiele cech. Klasy określane są przez cechy, natomiast cechy przez mierniki. Definicje poszczególnych klas i cech mogą zawierać mierniki krytyczne, które charakteryzują wymagania niezbędne do przeprowadzenia procesu oceny jakości informacji publicznej do ponownego użycia. Istotne jest, że mierniki mogą być krytycznymi w jednej klasie oraz niekrytycznymi w innej. Oznacza to, że ocena inkrementująca poziom klasy po kolejnym cyklu może mieć inny wpływ na pozostałe mierniki, mimo że wcześniej były one już oceniane lecz miały status niekrytyczny. Tak zdefiniowane wszystkie mierniki tworzą dla każdej klasy pierwotny wektor wejścia. Natomiast wyodrębnione mierniki krytyczne tworzą dla każdej z klas pierwotne wektory wymagań. 

 

W powyższych tabelach przedstawiono zestawienie mierników cech jakości informacji publicznej, uwzględnianych w modelu oceny informacji publicznej do ponownego użycia. W celu uzyskiwania spójnej oceny jakości informacji i potencjalnego zastosowania metody w różnych językach programowania, ocena informacji odbywa się poprzez przypisanie miernikom wartości boolowskich w postaci prawda / fałsz lub analogicznie 0 lub 1.

Mierniki te tworzą wektory klas:

 

K1 = (x11, x12, …, x1n)

K2 = (x21, x12, …, x1m)

K3 = (x31, x12, …, x1o)

K4 = (x41, x12, …, x1p)

K5 = (x51, x12, …, x1q)

 

Gdzie a, b, c, d, e są liczbami atrybutów w danej klasie, która może być w poszczególnych klasach różna.

 

Jednak w celu stopniowania ich wpływu na ocenę końcową w poszczególnych klasach jakości  konieczne jest wyposażenie mierników w wagi istotności. Przypisania wag czyli ich oceny dokonuje przynajmniej jeden ekspert. Zalecana liczba ocen ekspertów to 2. Jeśli oceny dokonywane są przez więcej niż jednego eksperta przypisywane przez nich wagi są normalizowane, co zostało opisane poniżej, w rezultacie czego każde kryterium otrzymuje jedną wagę.

W wyniku oceny kryteriów powstaje główny wektor wag, zawierający wektory wag poszczególnych klas.

Wg=(w1, w2, w3, w4, w5)

 

Po przypisaniu wag do kryteriów tworzone są pierwotne wektory wag w1, w2, w3, w4, w5 według schematu:

W1 = (w11, w12, … w1a)

W2 = (w21, w22, … w2b)

W3 = (w31, w32, … w3c)

W4 = (w41, w42, … w4d)

W5 = (w51, w52, … w5e)

 

W wariancie oceny wag przez kilku ekspertów wektory poszczególnych ocen zapisywane są jako wektory (wymiary pierwotnych wektorów wag). Wektory te mają tyle elementów, ilu jest oceniających ekspertów. Dla oceny jednego eksperta poszczególne wektory będą miały jeden element. W związku z tym poszczególne, przytoczone wyżej wektory wag są zapisywane w postaci wektorów wag ocen poszczególnych ekspertów, przy założeniu, że x oznacza nr eksperta a o – wagę przypisaną przez eksperta.

 

W11 = (o1, o2, …, ox)

 

Następnie, z wag przypisanych przez ekspertów do danego miernika obliczana jest średnia arytmetyczna według schematu:

 

W11’ = (o1 + o2 + … ox) / x

 

Gdy elementy w wektorze wag zawierają już uśrednione wartości elementów, są następnie w ramach wektorów sortowane rosnąco tzn. mogą przybrać, zależenie od wartości wag postać:

 

W1’ = (w1a’, w11’, w12’, …)

Wzór Błąd! W dokumencie nie ma tekstu o podanym stylu.‑1

Następnie określane są ostateczne wagi poszczególnych cech według wzoru

 

Wnm = N – (kj – 1 ) / N

 

 

gdzie W jest m-tym miernikiem w klasie n (n przyjmuje wartości od 1 do 5), a N oznacza skalę ocen wagi, kj jest numerem pozycji miernika w rozpatrywanym wektorze. Miernikom o tych samych wartościach przypisuje się ten sam numer pozycji. Skala wagi przyjmuje postać od 1 do N, gdzie N jest liczbą naturalną. Na potrzeby przedmiotowego modelu przyjęta została skala 5 stopniowa.

 

Wyznaczenie macierzy MWAGn. Z wektorów wag mierników, które poddane są transpozycji tworzone są dla poszczególnych klas macierze:

 

MWAG1 = (w11, w12, … w1a)T

MWAG2 = (w21, w22, … w2b) T

MWAG3 = (w31, w32, … w3c) T

MWAG4 = (w41, w42, … w4d) T

MWAG5 = (w51, w52, … w5e) T

Wzór Błąd! W dokumencie nie ma tekstu o podanym stylu.‑2

Na tym etapie wytyczone są już macierze wag ocen MWAG1, MWAG2, MWAG3, MWAG4, MWAG5.

 

 

4.5. Wyznaczenie macierzy MOC

 

W kolejnym kroku następuje klasyfikacja mierników każdej informacji mogącej być rozpatrywanej odrębnie (pojedynczo), także zbioru informacji, w ujęciu poszczególnych kryteriów. Wynikiem klasyfikacji jest ocena każdego miernika wartością 0 lub 1, gdzie 0 oznacza niespełnienie, a 1 spełnienie kryterium jakościowego określanego przez rozpatrywane kryterium z punktu widzenia użytkownika U. Nie spełnienie miernika krytycznego dla danej informacji w danej klasie powoduje przypisanie wszystkim kryteriom w danej klasie dla tej informacji wartości 0.

W wyniku tej oceny powstaje pięć macierzy oceny mierników cech: MOC1, MOC2, MOC3, MOC4, MOC5,  o wymiarach g x h, gdzie g jest liczbą analizowanych informacji, a h jest liczbą kryteriów w danej klasie.

Na tym etapie wytyczone są już macierze oceny mierników informacji MOC1, MOC2, MOC3, MOC4, MOC5 w poszczególnych klasach (1-5).

 

4.6. Wyznaczanie wskaźników jakości klas

 

Wyznaczenie wskaźnika jakości informacji w poszczególnej klasie odbywa się według poniższej zdefiniowanej zależności. Dla każdej klasy wskaźnik jakości informacji przyjmuje wartość od 0 do 1 i obliczany jest wg wzoru:

 

 

 

gdzie poszczególne oznaczenia to:

·       g – oznacza liczbę ocenianych informacji lub pojedynczych zbiorów danych,

·       n – numer klasy,

·       h – liczbę kryteriów w klasie n

·        – macierz ocen wszystkich informacji o wymiarach g x h w klasie n

·         – macierz o wymiarach g x 1 wypełnioną wartościami zerowymi oraz f-tym wierszem o wartości 1

·       MWAGn – macierz o wymiarach h x 1, wypełniona wagami kryteriów w klasie n

·         macierz o wymiarach h x 1wypełnioną wartościami 1.

 

Wskaźnik jakości przyjmuje w danej klasie wartości w przedziale < 0,1> i powinien być dodatkowo oznaczany graficznie symbolem gwiazdki.

 

 

4.7. Infograficzna reprezentacja wyników

 

Wskaźnik może być reprezentowany poprzez cztery kolory zależenie od jego wartości w danej klasie, według zasady przedstawione w poniższej tabeli.

 

 

Tabela 5 Infograficzna reprezentacja wartości wskaźnika jakości w danej klasie. Źródło. Opracowanie własne.

Poziom wskaźnika jakości

Wartość wskaźnika

Kolorystyka symbolu

1

0,00-0,09

2

0,10-0,33

3

0,34-0,79

4

0,80-1,00

 

 

Powiazanie wartości wskaźnika z kolorami zawiera powyższa tabela. W ujęciu mnemotechnicznym takie powiązanie jest istotne dla graficznego komunikowania wskaźnika w interfejsach systemów informatycznych i na stronach sieci web.

Dla przykładowych wartości wskaźników jakości w klasie piątej – J5

J1..5 = (0,851; 0,602; 0,553; 0,324; 0,095)

ocena informacji przyjmuje poniższą postać wynikową:

★ ★

 

 

Przedstawiony model pozawala zrealizować ocenę jakości informacji publicznej w celu ponownego użycia w sposób ustrukturyzowany, powtarzalny zapewniając porównywalną ocenę pomiaru jakości informacji. Elastyczność, a co za tym idzie trwałość modelu jest zapewniona dzięki wbudowaniu mechanizmów adaptacyjnych, dzięki którym parametry mogą być aktualizowane oraz dostosowywane do zastosowań dziedzinowych specyfiki informacji.

Opracowany model można rozpatrywać w ujęciach zależnych w szczególności od środowiska implementacji algorytmu realizującego działania modelu oraz dostępnych w środowisku oceny mierników do oceny cech informacji. Do mocnych cech modelu należy możliwość zastosowania wyniku oceny w inteligentnych i dynamicznych infografikach, aktualizowanych automatycznie online. Oznacza to również, że sam model może funkcjonować automatycznie generując i aktualizując wynik. Jest to szczególnie istotne przy ocenie cech związanych z aktualnością informacji. Zaletą modelu jest również ocena oparta o wartości boolowskie. Sprzyja to automatyzacji oceny wartości mierników na różnych platformach, gdyż uniezależnia od różnic środowisk informatycznych, nakładając jednak jednocześnie obowiązek jednoznacznej definicji mierników podczas ich tworzenia lub modyfikacji. Funkcjonowanie modelu oparte jest na ocenie cech informacji poprzez mierniki pomiaru. Jakość ocenianej informacji może być badana i pobierana do modelu w czasie wykonywania obliczeń. Przewidywane komplementarnie do modelu rozwiązanie implementacyjne w postaci repozytorium jest gwarantem spójności wersjonowania modelu. Repozytorium może wykonywać pomiar jakości jako element MaaS lub samodzielnie jako PaaS. Oznacza to, że do wykonania pomiaru nie będzie konieczne obciążanie infrastruktury przechowującej informacje oraz programistyczna implementacja algorytmów modelu, a jedynie dostęp do API portalu open data. Zatem otwartość modelu do operowania na metadanych ocenianej informacji jest jego mocną stroną sprzyjającą efektywności obliczeń. Z drugiej strony dostępność metadanych informacji musi być wtedy zapewnione, aby nie była konieczna manualna wersja prowadzenia oceny. Słabą stroną modelu jest niezastosowanie na tym etapie ważenia wag przypisywanych przez kilku ekspertów. Obecnie oceny ekspertów są uśredniane. W rzeczywistości może wystąpić konieczność nadania innego priorytetu dla wag nadanych przez eksperta klienta i strony eksperta urzędowej lub zastosowania jeszcze innej konfiguracji dla przypisywanych wag. Wprowadzenie różnicowania ocen powinno być przedmiotem dalszych badań nad modelem. Ograniczeniem modelu przekładającym się z kolei na prostotę jego implementacji jest pomijanie w ocenie aspektu ilości mierzonych informacji. Powoduje to że źródło które ma mało informacji może być faworyzowane względem źródła, które ma tych informacji bardzo dużą ilość, gdyż łatwiej utrzymać jakość w małym zbiorze niż w gigabajtach heterogenicznych zbiorów. Jak zaznaczono upraszcza to procedurę stosowania modelu ponieważ nie trzeba pobierać danych ze wszystkich źródeł przy pomiarze jakości tylko w jednym. Rozwiązaniem zasygnalizowanej cechy, podczas przyszłych prac, może być wprowadzenie propozycji kryteriów odnoszących się do ilościowej względności badanych danych, jednak z naciskiem na niewymaganie weryfikacji danych niebadanych portali online podczas obliczeń.

Niewątpliwą zaletą modelu jest jego utrzymywalność, czyli możliwość wykonywania zabiegów dostosowujących go do zmieniających się technologii i rozwiązań informatycznych oraz modyfikacji mierników jeśli specyfika informacji lub przeznaczenie oceny będą tego wymagały.

 

4.8. Wersjonowanie modelu

 

Dla zachowania spójności ocen różnych źródeł informacji takich jak portale open data model powinien być używany w przedstawionym oryginalnym kształcie. Jednak kształt ten nie będzie odpowiedni w każdym przypadku, w szczególności do oceny informacji dziedzinowej specyficznych obszarów, dla których wyznaczone cechy i mierniki nie będę miarodajne. Dlatego w drugim etapie stosowania modelu cechy i mierniki mogą być dostosowane poprzez ocenę i dostosowanie ich przez ekspertów do konkretnych zastosowań. Dla zachowania rozróżnienia ocen modelem z oryginalnymi kryteriami i zaktualizowanymi, należy stosować oznaczenia wersji modelu. Sposób tworzenia oznaczeń wersji modelu tworzony jest w następujący sposób. Oryginalny numer wersji modelu ma oznaczenie ODQM1.201508101, modyfikacje modelu powinny być oznaczane wersją odwołującą się do repozytorium, w którym zawarte będą szczegółowe informacje na temat dokonanych w modelu modyfikacji, autora modyfikacji, daty publikacji czy wersji. Numer wersji powinien być konstytuowany według schematu ODQMX.yyyy.mm.ddA, gdzie:

 

·       ODQM oznacza nazwę modelu[17]

·       X – unikalny identyfikator pod którym opublikowano modyfikację modelu w repozytorium

·       yyyy.mm.dd – datę publikacji w repozytorium

·       A – nr publikowanej wersji przez tego autora

 

Dopuszcza się stosowanie identyfikatora w wersji skróconej w postaci ODQM.X, gdzie X jest unikalnym identyfikatorem pod którym opublikowano modyfikację modelu w repozytorium. Repozytorium prowadzone jest przez wyznaczony do tego podmiot odpowiedzialny.

 

 

 

(ODQM1.201508101) CC BY 2.5 PL

Kontakt: instytutOS.pl

 



[1] Źródło: http://sjp.pl/model [Dostęp: 20.12.2013],

[2] Z ang. Open Data Quality Model,

[3] Z ang. Platform as a Service,

[4] Z ang. Model as a Service,

[5] Kolman R., Różne odmiany jakości, Agencja Wydawnicza Placet 2014, s. 220,

[6] Stefanowicz B., Informacja, Szkoła Główna Handlowa w Warszawie, 2004, s. 107-109,

[7] Na podstawie Open Data 5 Star Bernersa-Lee, Źródło http://www.w3.org/DesignIssues/LinkedData.html [Dostęp: 20.03.2014],

[8] Mowa tu o metodyce wytwarzania oprogramowania https://www.scrum.org [Dostęp: 20.03.2014],

[9] A ang. Unified Modeling Language, zob. https://pl.wikipedia.org/wiki/Unified_Modeling_Language [Dostęp: 20.03.2014],

[10] Mowa tu o metodyce Information Technology Infrastructure Library, Zob. https://www.axelos.com/best-practice-solutions/itil.aspx?utm_source=itil-officialsite&utm_medium=redirect&utm_campaign=redirects [Dostęp: 20.03.2014],

[11] UML

[12] Na podstawie modelu 5-star Open Data autorstwa Berenersa-Lee, Źródło: http://www.w3.org/DesignIssues/LinkedData.html [Dostęp 20.08.2015],

[13] Zob. Eppler, J. M., op. cit.,

[14] tj. kompletność, dokładność, jasność, zwięzłość, poprawność,

[15] Por. Rozdział 3,

[16] Wiarygodność źródła informacji,

[17]  Z ang. open data quality model,