Czym jest jakość danych i dlaczego ma tak duże znaczenie dla analityki biznesowej?
5 min read
“O jakości mówimy wtedy, gdy wraca do nas klient, a nie produkt” – ta popularna sentencja jest mottem wielu firm i zespołów. Zwróćmy uwagę, że klientem może być Zarząd, Dyrektor Finansowy czy Manager (tzw. klient wewnętrzny). Produkt zaś może stanowić raport czy analiza. Poświęćmy zatem chwilę na omówienie niezwykle ważnego w analityce biznesowej tematu, jakim jest jakość danych. O tym, dlaczego jest ona na tyle istotna. Można bowiem polemizować, czy lepszy jest całkowity brak analityki w określonym obszarze, czy zbiór chaotycznych, błędnych, tzw. “brudnych” danych. Od ich prawidłowości zależy efektywność wykorzystywanych narzędzi czy tworzonych raportów, na podstawie których finalnie podejmowane są decyzje biznesowe. Czym większa lub dynamiczniej rozwijająca się organizacja, tym więcej źródeł danych, których wzajemna i wewnętrzna spójność ma kluczowe znaczenie dla oceny sytuacji w określonych obszarach. Aby więc uniknąć chaosu informacyjnego, a w konsekwencji podejmowania błędnych decyzji, należy zadbać o właściwe zarządzanie całym procesem – czyli Data Quality Management (DQM). Rozwój technologiczny sprawił, że możliwości zbierania danych są obecnie wręcz nieograniczone. Firmy starają się dowiedzieć jak najwięcej o swoich klientach, aby móc dostosowywać ofertę czy przewidywać popyt. Działania pracowników są monitorowane, aby zlokalizować tzw. “wąskie gardła” i jak najefektywniej wykorzystywać ich czas. Do tego dochodzą przychody, marżowość oraz inne wskaźniki świadczące o efektywności przedsiębiorstwa. Aby wyciągnąć z tych wszystkich danych wskazówki do podjęcia konkretnych działań, konieczne jest spojrzenie na nie całościowo i identyfikacja KPI, które są najistotniejsze w danym obszarze. Pracownicy marnują do 50% czasu na nieefektywne wykonywanie zadań związanych z jakością danych (MIT Sloan) Zanim jednak zaczniemy analizować konkretne wskaźniki, warto zadać sobie pytanie: czy bazują one na wiarygodnych danych? Zobrazowany powyżej znaczący wolumen gromadzonych i przetwarzanych danych wymaga zarządzania ich jakością. Można to zdefiniować jako zestaw praktyk podejmowanych przez analityków i specjalistów w celu utrzymania nie tylko wiarygodności, ale i wysokiej jakości informacji. Praktyki te stosowane są w trakcie procesu przetwarzania danych: od pozyskania, poprzez wdrożenie, dystrybucję i analizę. Jak jednak zapewnić wysoką jakość danych? Zacznijmy od podstaw – monitorowanie, analiza i raportowanie nie będą mieć sensu, lub wręcz mogą prowadzić do błędnych wniosków, jeśli dane wsadowe nie będą zgodne ze stanem faktycznym i tym samym nie będa wiarygodne. Zweryfikowanie ich poprawności oraz opracowanie procedur ich oczyszczania, oceny czy weryfikacji spójności powinno być zadaniem obowiązkowo poprzedzającym dalszą pracę z danymi. 41% ekspertów w zakresie marketingu B2B wskazuje niespójność danych jako największą przeszkodę w maksymalizacji ROI (zwrotu z inwestycji) (Dun & Bradstreet) Aby więc skutecznie zarządzać jakością danych, konieczna jest odpowiednia strategia. Najważniejszymi jej elementami są: Do efektywnego zarządzania danymi w organizacji niezbędne jest zapewnienie czystości danych, do czego nawiązaliśmy w poprzednim akapicie. Teraz rozwiniemy ten wątek o wyjaśnienie, co kryje się pod tym pojęciem oraz jaki jest jego cel. Jeśli działasz w oparciu o niskiej jakości dane, istnieje duże prawdopodobieństwo, że nie dostarczasz klientom wystarczającej wartości, co może prowadzić do niewykorzystanych szans i utraty przychodów. Firmy tracą nawet 20% przychodów z powodu złej jakości danych! (Kissmetrics) Oczyszczanie danych to wykrywanie i usuwanie lub korekta informacji w bazie danych, w przypadku gdy są one błędne, powielane, niedokładne, nieaktualne, zbędne bądź nieprawidłowo sformatowane. Można robić to ręcznie lub z pomocą algorytmów, a cel tych działań jest ten sam – optymalizacja jakości danych, którym można ufać przy podejmowaniu trafnych decyzji biznesowych. Jest to czasochłonny proces, który analitykom danych zajmuje około 60% czasu pracy! Ważnym elementem jest tu zatem automatyzacja procesów i identyfikacja przyczyny powstawania wadliwych danych. Od dokładnego wykonania tego procesu zależy jednak sukces całej operacji. Najważniejsze etapy oczyszczania danych to: Co zyskasz dzięki zarządzaniu danymi? Przede wszystkich pewność, że podejmujesz decyzje biznesowe w oparciu o wiarygodne dane. Zanim rozpoczniesz szczegółową dyskusję o kształcie raportów analitycznych czy zarządczych, zadbaj o to, by powstawały one w oparciu o dobrze zweryfikowane, spójne, zrozumiałe źródła. Warto również w jak największym stopniu zautomatyzować walidację i przetwarzanie danych, eliminując omylny czynnik ludzki i przyspieszając przygotowanie danych do raportów. Choć opisany proces wydaje się trudny i kosztowny, do sprawnego zarządzania jakością danych wcale nie musisz mieć profesjonalnej hurtowni danych i ogromnego budżetu. Ważne są zoptymalizowane procesy i nastawienie pracowników, a w pozostałych aspektach pomoże odpowiednie know-how i technologia. Jeśli potrzebujesz wsparcia w obszarze zarządzania danymi w Twojej firmie, skontaktuj się z nami. W Enterium wykorzystujemy odpowiednie narzędzia i techniki ETL (wyodrębniania, przekształcania i ładowania danych). Pracujemy głównie w ekosystemie Microsoft, jednak dużą wagę przywiązujemy do wartości biznesowej docelowego kształtu zestawów danych. Zawsze podstawą naszych działań jest zrozumienie biznesu klienta, aby precyzyjnie określić jego potrzeby i opracować docelowy kształt zestawów danych, które będą najbardziej użyteczne analitycznie na dalszych etapach współpracy.Czym jest jakość danych i dlaczego ma tak duże znaczenie dla analityki biznesowej?
Jakość danych – mniej znaczy więcej
Co decyduje o wysokiej jakości danych?
Zarządzanie jakością danych – klucz do sukcesu
Higiena baz danych (czystość danych)
Inwestycja w profesjonalizację zarządzania danymi
We are increasing company value, for real