Správa dat Vs Data Science

"Ahoj, Chichi." Rád vás poznávám. Takže, co děláš?"

S nejlepším úsměvem "Jsem správce dat."

Se zmateným úsměvem "Ermm ... co to znamená?"

************************

Protože se Data stala velmi populární, mohu vsadit (i když nehraji), že jste asi slyšeli o roli Data Scientist. Pokud nerozumíte, co to je, dávejte si pozor na můj příspěvek v některých klíčových profesích dat. Na druhé straně je role Správce dat vzácná. Co to vlastně je?

V širším slova smyslu je řízení koordinací lidí a / nebo aktivit k dosažení některých cílů. Podobně je správa dat

„Koordinace lidí, procesů a datových toků za účelem dosažení některých stanovených cílů - které by měly zahrnovat nebo vést k odvození hodnoty z dat.“

Zběžný pohled na tuto definici může vykreslit obrázek správy dat jako pouhou správu dat. Pravda je, že správa dat je spousta správy dat, ale mnohem více. Orgán správy údajů definuje správu dat jako

„Vývoj, provádění a dohled nad plány, politikami, programy a postupy pro poskytování, řízení, ochranu a zvyšování hodnoty datových a informačních aktiv během jejich životního cyklu.“

Činnosti v oblasti správy dat sahají od technických, jako je například datové inženýrství, až po netechnické, jako je správa dat. Orgán pro správu dat specifikuje 11 oblastí znalostí, které pokrývají:

  • Architektura a modelování
  • Skladování a operace
  • Bezpečnostní
  • Kmenová data, referenční data, správa dokumentů, obsahu a metadat
  • Integrace a interoperabilita
  • Skladování a obchodní zpravodajství
  • Kvalitní
  • Správa věcí veřejných

Takže, „kde je Data Science?“, Můžete se zeptat. (Pokud vám nevadí nějaký humor, je to v kapitole 14 druhého vydání Body of Knowledge.)

Data Science je analýza a vizualizace Big Data. Jedná se o specifickou technickou roli, která staví na aplikaci několika oblastí znalostí v oblasti správy dat.

Pojďme si trochu praktičtější.

Vědec údajů se primárně zajímá o to, co je možné s konkrétním velkým souborem dat. Datový vědec musí najít informace a odpovědi na otázky, které nebyly předem určeny (na rozdíl od analytika, který zkoumá, jak odpovědět na některé známé obchodní otázky daty). Mezitím se Správce dat zabývá celým datem podniku / oddělení / domény, nejen konkrétním datovým souborem. Manažer se zajímá o zachování integrity dat po celou dobu jejich životnosti a zajišťuje, aby k nim mohli účinně přistupovat ti, kteří je potřebují využít. Tato datová role vyžaduje akutní povědomí o obchodních cílech a také o tom, co by se mělo dělat na technické stránce.

A teď si trochu realističtější!

Dilema profesionálů v oblasti dat spočívá v tom, že hranice mezi rolemi se stále více stírají, ale současně je vyžadována hloubka v určitých oblastech. Pokud chcete být cennějším správcem dat, měli byste mít více než základní úroveň odborných znalostí v oblasti vědy o datech. Podobně by se prozíravý datový vědec neměl pyšnit pouze na statistickou a algoritmickou zdatnost, ale měl by myslet na data jako na živou bytost procházející cyklem, kterou je třeba spravovat.

*********************

Co mám dělat?

Pomáhám organizacím získávat hodnotu tím, že vyvíjím, prováděním a dohlížím na strategie, politiky, procesy a projekty, které získávají, zlepšují a používají data a poskytují k nim snadný budoucí přístup. Pokud se stane, že data jsou velká a je potřeba strojového učení, neváhám modely trénovat!