Dane są podstawą informacji biznesowych pozwalających podejmować trafne działania i osiągać maksymalne korzyści. Zarządzanie danymi, to złożony proces kompletowania, przechowywania i wykorzystywania danych w taki sposób, aby był on w pełni bezpieczny i pomagał w ich optymalnym wykorzystaniu. Zarządzanie danymi odbywa się w 6 kategoriach:
1) Katalogowanie i modelowanie,
2) Weryfikacja danych,
3) Profilowanie,
4) Czyszczenie,
5) Zarządzanie,
6) Działania operacyjne.
W dzisiejszym wpisie omówimy pierwszy z nich.
Katalogowanie i modelowanie
W tej kategorii działań chodzi o zdobycie wiedzy na temat danych, które generowane lub wykorzystywane są w instytucji.
Identyfikacja/inwentaryzacja źródeł danych jest krokiem wykonywanym „ręcznie” – bez pomocy specjalizowanych narzędzi. Etap ten wykonywany jest przede wszystkim przez biznes. Osoby korzystające z danych wiedzą z jakich danych korzystają, które dane są dla nich kluczowe.
AZ Frame oraz Precisely mają doświadczenie w realizacji projektów Data Governance. Na przestrzeni paru lat wypracowaliśmy algorytmy i wzorce dokumentów, które usprawniają ten proces. Dzięki temu proces bazujący na pracy „ręcznej” będzie wykonany szybko i sprawnie. W celu dodatkowego usprawnienia całości procesu platforma Precisely udostępnia funkcjonalności Data Catalog, z których korzystamy w trakcie prac u naszych Klientów. Elementy tego kroku to:
- Katalogowanie danych,
- Definiowanie kluczowych tabel,
- Definicja standardów danych,
- Definicja kluczowych relacji.
Organizacja musi zidentyfikować wszystkie źródła danych, określić ich priorytet, umiejscowienie, osoby odpowiedzialne. AZ Frame może wspomóc Państwa w skatalogowaniu źródeł danych, dzięki doświadczeniu w podobnych projektach, wypracowanym procedurom i dokumentom wspierającym ten etap. Przez źródła danych należy rozumieć nie tylko informacje zawarte w bazach danych, ale również dokumenty, arkusze MS Excel, strony intranetowe itp.
Aby czerpać wartościowe informacje z danych, organizacja powinna najpierw zrozumieć ich aktualny stan oraz jakie atrybuty są dostępne. Narzędzie Precisely Discovery umożliwia skanowanie (rozpoznanie struktur) milionów tabel / pól z tysięcy źródeł w celu wygenerowania spójnej biblioteki opisującej, jakie i gdzie zasoby danych posiadamy w organizacji. Moduł Data Catalog zapewnia jednolity widok wszystkich skonfigurowanych połączeń.