logo KOMIX s.r.o.

Big Data spolehlivě a rychle zpracuje QlikView

Potřeby analytického uživatele plně splňují systémy podporující tzv. in-memory asociativní analýzu, jejichž představitelem je nástroj QlikView, který si můžete vyzkoušet v plné verzi a bez časového omezení.

Každá organizace generuje svou činností velké množství dat. Společnosti pracující se zákazníky shromažďují data o jejich nákupním chování. Organizace veřejné správy a vládní instituce pracují s daty o obyvatelstvu, jeho demografickém, pracovním, ekonomickém nebo zdravotním stavu, průmyslové podniky monitorují průběžně stavy různých zařízení a systémů a samo IT produkuje další data o tom, jak správně či chybně pracuje.

Takovýchto dat přibývá stále rychleji, údajně 80 % jich vzniklo za poslední 2 roky, jejich velikost se celosvětově odhaduje na biliony terabytů, a tak hovoříme o fenoménu velkých dat, tedy Big Data.

(Ne)možnosti práce s Big Data

Pro uchování velkých dat existuje řada systémů, jako např. hadoop clustery, což jsou nákladově výhodné, distribuované, souborové systémy pracující na běžně dostupných platformách či celopodnikové datové sklady založené na technologiích různých výrobců.

Většina dnešních řešení Big Data je tedy orientována na zpracování masivních objemů dat. Business uživatelé ale potřebují pro smysluplné analýzy a reporty přístup nejen k těmto velkým datům ale i k dalším zdrojům dat z provozních systémů, spreadsheetů, pomocných systémů či internetu.

Stávající systémy pracující s Big Data nejsou obvykle navrženy pro analýzy řízené uživateli (user-driven analytics), ale jsou převážně orientovány na škálovatelnost, a nikoli výkon - vyřizování analytických dotazů je proto velmi pomalé. Navíc jednotlivé dotazy vyžadují napsání příslušných programů a není tedy podporován koncept ad-hoc dotazů.

Podobně je to s tradičními nástroji Business Intelligence (BI) závislými na součinnosti IT. V nich jsou pro předem očekávané dotazy připravena příslušná datová schémata, jednotlivé dotazy jsou řešeny lineárním vnořováním po předdefinovaných cestách.

Uživatel tak nemá možnost svobodné volby a jím požadované změny pak trvají dlouho a jsou nákladné.

Práce s Big Data lépe a snadněji

V prostředí QlikView uživatel samostatně rozhoduje, kde své dotazování začne a jak jej bude dále rozvíjet, má k dispozici veškerá data, která jsou uložena v operační paměti, a požadované dotazy a změny jsou proto extrémně rychlé a efektivní.

"Možnosti nástroje QlikView tak překračují běžně chápaný obsah pojmu Business Intelligence a definují novou oblast, tzv. Business Discovery. Nástroj této kategorie musí umožňovat uživateli, aby mohl samostatně pokládat následující dotazy na základě výsledků dotazů předchozích," říká Tomáš Třmínek, Key Account Manager společnosti KOMIX s.r.o.

Data v prostředí in-memory architektury jsou v průměru komprimovány v poměru 1:10, takže např. při kapacitě 256 GB serverové paměti to představuje možnost pracovat s více než 2 TB vstupních dat, což umožňuje analýzy milionů řádek dat s vteřinovými odezvami. 2 TB dat nejsou málo, ale stále se nejedná o Big Data, jak jsou definována výše.

"V prostředí QlikView je pro práci s externí Big Data infrastrukturou využita funkčnost, tzv. Direct Discovery. Jedná se o hybridní přístup, který umožňuje propojit in-memory data s daty získanými dynamickými dotazy z externích zdrojů. Agregované výsledky dotazů jsou zaslány do objektů QlikView, aniž by byly nataženy do jeho datového modelu. Tento výsledek tak umožňuje asociativní operace se všemi daty", doplňuje Tomáš Třmínek.

Business uživatel pracuje s Big Daty bez znalosti programování a v kontextu s ostatními daty, v případě potřeby je zachována možnost drilovat až na příslušný detail. To, kdy je využita funkce Direct Discovery, může uživatel poznat pouze tak, že vyřízení příslušného dotazu není tak okamžité, jak je při práci s daty in-memory zvyklý.

Toto zpomalení je možné ale ovlivnit jak návrhem architektury řešení, tak možností kešovat (rovněž v in-memory) výsledky externích dotazů pro rychlejší znovupoužití.

V in-memory jsou proto obvykle alokována data, která jsou uživatelem z hlediska četnosti používána často (detailní data za aktuální období, relevantní a kontextová data, agregované, sumární či průměrné údaje za definovaná období), zatímco data, která jsou uložena v rozsáhlých faktových tabulkách, které nelze do in-memory uložit nebo přístup k nim je předpokládán s minimální četností, jsou ponechána v externích zdrojích.

Tato nová funkcionalita nástroje QlikView tak umožňuje využít nástroj kategorie Business Discovery i pro oblast Big Data. Není náhradou in-memory technologií ale jejich doplněním pro přístup k externím datům.

Další články k tématům - analýza - Big Data - infrastruktura - komprimace - QlikView - server - Tomáš Třmínek

Článek KOMIX s.r.o. ze dne čtvrtek 19. června 2014

Další články od KOMIX s.r.o.

IoT kompetenční centrum s platformu pro efektivní provoz a využití

Projektové řízení s ADVANTA 3.0

Univerzální expertní systém ERIAN

Efektivní měření výkonnosti firem

Firemní sociální síť s ADVANTA snadno a rychle

Big Data spolehlivě a rychle zpracuje QlikView

Finanční reporting s QlikView

ADVANTA - řízení projektů a organizací s funkcemi sociálních sítí

KOMIX obhájil vysokou kvalitu poskytovaných IT služeb

KOMIX oznamuje změnu ve vlastnické struktuře

QlikView je uživatelsky nejlépe hodnocený nástroj v oblasti Business Intelligence

Dokončení změny korporátní identity KOMIX

Bezpečná realizace rozsáhlých IT projektů na konferenci LaTes 2013

Martin Podveský: nový Business Consultant společnosti KOMIX

QlikView mezi leadry v oblasti Business Intelligence

Cestovní pojištění v mobilu

KOMIX se dlouhodobě podílí na řadě významných projektů

KOMIX s certifikací jakosti CQS pro vývoj software a poskytovaní IT služeb

KOMIX klade důraz na péči o životní prostředí a ochranu zdraví svých zaměstnanců

Odborný seminář se zaměřením na Application Life-Cycle management

Tomáš Rutrle: nový generální ředitel společnosti KOMIX

Radek Šubrt: nový Senior Business Consultant společnosti KOMIX

eNeschopenky.cz startují elektronickou komunikaci mezi lékaři a ČSSZ

Prestižní ocenění HP Software GOLD Partner 2011 pro KOMIX

eNeschopenky zjednoduší komunikaci mezi lékaři a ČSSZ

Integrační platformu portálu OZP dodá KOMIX

CAS genesisWorld: nová verze CRM řešení v češtině

KOMIX rozšiřuje aplikaci pro Sdružení SOS dětských vesniček

BI QlikView od KOMIX na konferenci ICT ve finančních institucích

KOMIX zajistí rozvoj a podporu programu Zelená úsporám do roku 2012

Nové democentrum pro testování SAP

Cerifikované partnerství Microsoftu s kompetencí CDS pro KOMIX

Konference Moderní databáze 2010

Zlatý erb 2010 pro Zakázky pod Lupou

Inxmail Professional s českou mutací od KOMIX

Inxmail Professional pro Českou republiku

CAS PIA, jednoduchý CRM nástroj za akční cenu

KOMIX zve na tradiční konferenci LaTes