Mýty o datové analytice

Obsah

Nejrozšířenější mýty o datové analytice

Data science je multidisciplinární přístup pro hledání, extrahování a zvýrazňování vzorců v datech. Kvůli svému potenciálu se do analytických nástrojů investují miliony dolarů ročně. S datovou analytikou je spojeno spoustu zvláštních mýtu, některé se pokusíme v následujícím článku vysvětlit.

1. mýtus: „Datoví údržbáři“

Přibližně 70 % dat v databázích podniků nejsou vhodné, protože analytický tým s nimi nemůže pracovat. A zároveň je všeobecně známo, že 80 % času stráví datoví vědci na úpravách a transformaci dat a pouze 20 % času věnují analýzám.

Problém úpravy dat tkví v tom, že jde o velmi jednotvárnou činnost. Tato práce se většinou předává datovým inženýrům, kteří mají na starosti všechny činnosti ohledně transformace, extrakce a dalších potřebných úprav dat. Potom se hlásí ke slovu datový vědci, kteří s daty dále pracují a upravují si je podle svých potřeb, aby je mohli použít v analýzách a modelech. Špatná souhra mezi lidmi, procesy a nástroji má potom za následek neefektivní přístup k analytice, neustálou komunikaci mezi všemi zúčastněnými, zpoždění a chyby.

Pravda: Datoví vědci mohou být stejné osoby jako datoví údržbáři. Stejně každý den pracují s daty a různými datovými formáty. Moderní přístupy v data science zahrnují všechny osoby od datových inženýrů, přes vědce až po analytiky. Každá z těchto osob se podílí na čistění a transformaci dat. Díky spolupráci všech členů týmu na časově náročných částech procesu, mohou společnosti zvýšit produktivitu týmu.

 

2. mýtus: Machine learning nahradí datové vědce

Datoví vědci jsou v centru pozornosti již řadu let. Hlavní ekonom Google, Hall Varian, řekl, že je to “nejvíc sexy práce na světě”.

Brzy na to vývojáři softwarů přišli s tím, že nástroje datových vědců jsou tak jednoduché na použití, že jejich práce v budoucnu již nebude potřeba. Avšak přišlo se na to, že datoví vědci jsou nepostradatelní v oblasti predikce. Na každý tým analytiků totiž existuje tým vedoucích pracovníků, kteří využívají jejich data k lepšímu rozhodování v podniku.

Pravda: Datoví vědci zůstávají. Jsou jádrem podniku a měli by být podporování nástroji, technologiemi a postupy, které jim pomohou rozšiřovat znalosti a talent. Data science je v současné době dostupná na vysokých školách. Brzy se počítá s tím, že bude dostupná i mladším generacím.

Datoví vědci jsou důležití dnes a budou důležití i v budoucnosti.

 

3. mýtus: Není možné současně sdílet a chránit data

Analytické týmy potřebují rychlý a snadný přístup k datům. Jenže data jsou pravděpodobně nejcennějším aktivem podniků bez ohledu na jejich oblast působení. Musí být chráněna a zpracovávána s nejvyšší mírou zabezpečení. Správci databází a big dat jsou obvykle pověřeni zpřístupňováním dat v rámci svého podniku, avšak zároveň si musí být jisti, že přístup k datům dodržuje zásady správy a zabezpečení společnosti. Z toho důvodu přístup k datům v rámci podniku může poněkud váznout.

Pravda: Leadři v oblasti analytiky se naučili vytvářet procesy a závádět nástroje, které umožňují přístup do databází na základě rolí a tím umožňují plynulou komunikaci mezi datovými inženýry, datovými vědci, analytiky a manažery. Zaměstnanci firmy díky tomu mají možnost okamžitě vyhledat a prozkoumat datasety, které potřebují.

 

 

 

 

Další články

Geo-analytika na vzestupu

Geo-analytika kombinuje tradiční analytiku s informacemi o poloze, aby poskytla lepší kontext a perspektivu studovaných dat. Geografické umístění a další prostorové informace mohou rozšířit a