Business Intelligence i SAP – próba porównania

Duże ilości danych przetwarzanych w przedsiębiorstwach należy postrzegać jako źródło wiedzy potrzebnej do podejmowania trafnych decyzji biznesowych.

Automatyzacja źródłem wiedzy

Postęp w informatyce umożliwił automatyzację procesów biznesowych w przedsiębiorstwach. Automatyzacja pozwala usprawnić działanie firmy, ograniczyć koszty i w ten sposób utrzymać konkurencyjność firmy na rynku. Wiąże się z tym jednak konieczność przetwarzania coraz większej ilości danych. Czy gromadzenie i przetwarzanie tych danych to tylko niezbędny koszt poprawiania efektywności? Nie należy tego tak postrzegać. Dane należy widzieć przede wszystkim jako źródło wiedzy, którą można wykorzystać do podejmowania decyzji biznesowych.

Systemy OLTP

Czy jednak systemy transakcyjne (OLTP – Online Transaction Processing) takie jak np. ERP, CRM lub inne tej klasy mogą posłużyć nam do wygenerowania raportów umożliwiających analizę przetwarzanych przez nie danych? Oczywiście mogą, ale nie jest to rozwiązanie efektywne, elastyczne i nie obejmuje dostatecznie szerokiego spektrum danych. Systemy OLTP nie są zoptymalizowane pod kątem analizy danych, z czym wiąże się wiele problemów:

  • kwestia wydajności – przy raportach operujących na dużym zakresie danych (a jest to częsty przypadek szczególnie przy raportowaniu do celów taktycznych i strategicznych) czas realizacji pojedynczych zapytań w systemie i generowania raportów bywa nieakceptowanie długi, może to trwać nawet wiele godzin. Proces odczytu i analizy danych musi bowiem konkurować z procesami zapisu, modyfikowania i usuwania danych będącymi podstawowymi procesami w systemach transakcyjnych. Samo raportowanie również obciąża system, szczególnie jeśli raporty generowane są wielokrotnie i przez wiele osób. Architektura systemów transakcyjnych nie jest optymalizowana pod kątem zapytań analitycznych.
  • heterogeniczność danych pochodzących z różnych systemów – w firmach nierzadko funkcjonuje równolegle kilka różnych systemów informatycznych, wdrożonych w różnym czasie i przechowujących dane w różnych formatach. Dane mogą również pochodzić z plików zewnętrznych lub z internetu. Porównywanie takich danych w procesie analizy bez ich uprzedniego przygotowania może być niemożliwe.
  • częsty brak możliwości w pełni dynamicznego dostosowywania raportów w systemach OLTP, tzn. zestawiania danych w różnych konfiguracjach zależnie od aktualnej potrzeby analityka, zwiększania lub zmniejszania poziomu szczegółowości w procesie analizy.

Proste rozwiązanie

Odpowiedzią na te problemy są aplikacje OLAP (Online Analytical Processing) wchodzące w skład Business Intelligence, stanowiące uzupełnienie dla aplikacji OLTP. Są one specjalnie projektowane pod kątem efektywnego raportowania. Bazy danych konfigurowane dla takich aplikacji wykorzystują wielowymiarowy model danych. Wielowymiarowość pozwala na efektywne jednoczesne analizowanie danych w wielu wymiarach, takich jak np. czas, region, grupa produktów i wiele innych, przy czym możliwe jest tu hierarchiczne zwiększanie lub zmniejszanie stopnia szczegółowości raportowanych danych (tzw. drążenie – drill down/across), jak np. dzień, tydzień, miesiąc; dzielnica, miasto, region, kraj; napoje gazowane, napoje, produkty spożywcze; itp.
Na bazach danych konfigurowanych dla OLAP osadzane są hurtownie danych. Terminem hurtownia danych Bill Inmon nazwał (w 1990 roku): tematycznie zorientowany, zintegrowany, trwały i uwzględniający atrybut czasu (time-variant) zbiór danych wykorzystywany w procesie podejmowania decyzji.
Hurtownia danych bardzo dobrze rozwiązuje kwestię wydajności raportowania na dużych zestawach danych. Przechowuje ona skopiowane dane transakcyjne, które ulokowane są zwykle na oddzielnej bazie danych, na oddzielnym serwerze. W ten sposób przeprowadzanie analiz wykorzystujących zapytania odczytujące duże ilości danych nie wpływa na wydajność systemu transakcyjnego i same zapytania wykonują się znacznie szybciej, w czasie liczonym w sekundach, najwyżej w minutach. Dane w hurtowni przechowywane są nie tylko jako dane szczegółowe, ale również nadmiarowo jako agregaty, co również istotnie wpływa na zwiększenie wydajności raportowania.
Systematyczne zasilanie hurtowni nowymi danymi, czyli kopiowanie danych z systemów transakcyjnych, odbywa się generalnie po zakończeniu dnia pracy, zwykle w godzinach nocnych, co nie obciąża systemów transakcyjnych. Taka częstotliwość uaktualniania danych jest dla raportowania strategicznego lub taktycznego w zupełności wystarczająca.
W przypadku, gdyby jednak niektóre dane w hurtowni musiały być częściej aktualizowane, co może być potrzebne dla raportowania operacyjnego, można w ich przypadku zastosować proces RDA – Real Time Data Acqusition. W procesie tym wybrane obiekty hurtowni zasilane są danymi transakcyjnymi z wysoką częstotliwości, np. co kilka minut, czyli w czasie bliskim rzeczywistemu. Innym rozwiązaniem jest realizowanie zapytania za pośrednictwem obiektów hurtowni, zwanych dostawcami wirtualnymi, które odwołują się do danych znajdujących się nie w hurtowni, lecz bezpośrednio w systemie źródłowym. Wydajność w tym przypadku jest jednak niższa i sposób ten jest dlatego wykorzystywany jedynie na mniejszym zakresie danych i tylko przez pojedynczych użytkowników.
Zastosowanie hurtowni danych rozwiązuje również problem heterogeniczności danych pochodzących z różnych systemów źródłowych, baz danych, plików i internetu. Poprzez kopiowanie tych danych do hurtowni, są one dostępne dla całego przedsiębiorstwa w jednym miejscu i przez długi czas. Ponadto w hurtowni ma miejsce proces „czyszczenia” danych i takiego ich przekształcania, aby mogły one być jednolicie wykorzystywane w procesie analizy niezależnie od źródła ich pochodzenia.
Raportowanie na hurtowni SAPa umożliwia prezentowanie raportów w bardzo zaawansowanej formie graficznej, przesyłanie ich lub umieszczanie na portalu korporacyjnym w bardzo zróżnicowanym zakresie, przy uwzględnieniu praw dostępu i zakresu obowiązków poszczególnych pracowników. Ponadto, jeśli raportowane dane znajdą się np. w niekorzystnym przedziale wartości, istnieje możliwość automatycznego powiadamiania odpowiednich osób poprzez generowanie i przesyłanie ostrzeżeń.

Data Mining

Dane pochodzące z różnych systemów źródłowych, a następnie ujednolicone i zharmonizowane w hurtowni danych w procesie ETL (Extract, Transform, and Load), są dobrym materiałem do wykorzystania w procesach data miningu. Data mining stosuje różnego rodzaju algorytmy matematyczne pozwalające odkryć interesujące wzorce i zależności trudne do zauważenia w dużej ilości danych. W ten sposób możemy zauważyć, że np. w jakiejś maszynie usterka jednego rodzaju często współwystępuję z usterką innego rodzaju lub że klienci kupujący u nas towar A często jednocześnie kupują towar B. Dzięki takim informacjom możemy lepiej zaplanować procesy serwisowania maszyn albo w lepszym układzie zaprezentować nasze produkty, aby zwiększyć sprzedaż i poziom zadowolenia klientów. Metody data mining pozwalają również na przewidywanie niektórych przyszłych zależności na podstawie dotychczasowego „doświadczenia” zawartego w danych, np. pozwalają prognozować, w jaki sposób będzie wyglądała sprzedaż naszych produktów w poszczególnych grupach klientów lub jakie jest prawdopodobieństwo terminowej zapłaty przez klientów z określonej grupy.
Tak więc Business Intelligence w oparciu o hurtownię danych umożliwia efektywne analizowanie bieżącej sytuacji w przedsiębiorstwie oraz – przy pomocy procesów data mining – wydobycie dodatkowej wiedzy z posiadanych danych. Umożliwia to dokładniejsze przewidywanie przyszłości i podejmowanie lepszych decyzji biznesowych. SAP jest jednym z głównych dostawców hurtowni danych, jako modułu działającego zarówno na systemach zarówno SAP jak i innych. Z hurtownią danych SAP zintegrowany jest proces data minning pozwalający na zapis uzyskanych w ten sposób informacji na powrót do hurtowni lub do modułu CRM.

 

Opracowanie:
Business Partners eXcellence

Business Partners eXcellence

SAP ERP
SAP All-in-One

QlikView
Qlik Sense

Infor SyteLine ERP