
Daten sind das Gold von heute
Daten-Governance und Daten-Management

www.dataversity.net/the-difference-between-data-governance-data-management/
Der Unterschied zwischen Daten-Governance und Daten-Management:
- Daten-Governance: Daten-Governance bezieht sich auf die Richtlinien, Standards, Verfahren und Verantwortlichkeiten, die festlegen, wie Daten in einer Organisation gehandhabt werden. Sie konzentriert sich auf die Einhaltung von Vorschriften, Datenschutz, Datensicherheit und die Qualität der Daten. Daten-Governance legt den Rahmen und die Regeln fest, nach denen Daten verwaltet werden.
- Daten-Management: Daten-Management umfasst die technischen Aspekte der Datenerfassung, -speicherung, -organisation, -pflege und -nutzung. Es beinhaltet Praktiken wie Datenarchitektur, Datenmodellierung, Datenlagerung, Datenqualität und Datenanalyse. Daten-Management ist die praktische Umsetzung der durch die Daten-Governance vorgegebenen Richtlinien und Standards.
Kurz gesagt, Daten-Governance definiert die Richtlinien und den Regelrahmen für die Datenhandhabung, während Daten-Management die praktische Implemen
Weitere wichtige Begriffe im zusammenhang mit Daten
Datengesteuert (Data-Driven):
bezieht sich auf einen Ansatz oder eine Methode, bei der Entscheidungen und Handlungen auf der Grundlage der Analyse und Interpretation großer Datenmengen basieren, anstatt auf Intuition oder Erfahrung.
Big Data:
Sehr große Datenmengen, die aus verschiedenen Quellen stammen und mittels spezieller Technologien verarbeitet werden.
Data Mining:
Der Prozess des Entdeckens von Mustern und Erkenntnissen aus großen Datenmengen.
ETL (Extract, Transform, Load):
Ein Prozess, bei dem Daten aus verschiedenen Quellen extrahiert, transformiert und in ein Data Warehouse geladen werden.
NoSQL-Datenbanken:
Datenbanksysteme, die eine flexible Speicherung von Daten ermöglichen und nicht auf das relationale Modell angewiesen sind.
API (Application Programming Interface):
Eine Schnittstelle, die es verschiedenen Softwareanwendungen ermöglicht, miteinander zu kommunizieren und Daten auszutauschen.
Blockchain:
Eine verteilte Datenbanktechnologie, bekannt für ihre Rolle in Kryptowährungen, die Transparenz und Sicherheit durch eine unveränderliche Aufzeichnung von Transaktionen bietet.
Datenintegration (Data Integration):
Der Prozess des Zusammenführens von Daten aus unterschiedlichen Quellen in einen kohärenten Datensatz.
Data Cleansing (Datenbereinigung):
Der Prozess der Korrektur oder Entfernung fehlerhafter, doppelter oder unvollständiger Daten aus einer Datenbank.
Metadata (Metadaten):
Daten, die Informationen über andere Daten bereitstellen, wie z.B. Erstellungsdatum oder Format.
Data Governance:
Der Prozess der Festlegung von Richtlinien, Standards und Verfahren zur Datenverwaltung und -qualität.
Business Intelligence (BI):
Technologien und Praktiken zur Sammlung, Integration, Analyse und Darstellung von Geschäftsdaten zur Entscheidungsfindung.
Machine Learning:
Ein Bereich der künstlichen Intelligenz, der sich mit der Entwicklung von Algorithmen befasst, die aus Daten lernen und Vorhersagen treffen können.
Data Mining:
Der Prozess des Auffindens von Mustern, Korrelationen oder Erkenntnissen in großen Datensätzen.
Predictive Analytics:
Analysetechniken, die historische Daten verwenden, um Vorhersagen über zukünftige Ereignisse oder Trends zu machen.
Data Virtualization:
Eine Technik, die es ermöglicht, Daten aus verschiedenen Quellen zu abstrahieren und zu integrieren, ohne diese physisch zu kopieren oder zu verschieben.
Data Federation:
Eine Technik zum virtuellen Zusammenführen von Daten aus verschiedenen Quellen, ohne diese physisch zu verschieben oder zu kopieren.
Digital Scale:
bezeichnet die Nutzung digitaler Technologien zur effizienten Skalierung und Optimierung von Geschäftsprozessen und -modellen, um Wachstum und Wettbewerbsfähigkeit in der digitalen Wirtschaft zu steigern.
IT Capability Model:
ist ein Rahmenwerk, das die Fähigkeiten und Ressourcen einer IT-Organisation strukturiert darstellt, um deren Effektivität und Beitrag zur Geschäftsstrategie zu bewerten und zu verbessern.
Business Model Canvas:
ist ein strategisches Managementwerkzeug, das neun Schlüsselelemente eines Geschäftsmodells übersichtlich auf einer einzigen Seite darstellt, um dessen Struktur, Wertangebot, Kunden, Finanzen und Betriebsabläufe klar zu erfassen und zu analysieren.
Untererschied zwischen Data Lake & Data Warehouse
- Data Warehouse:
- Strukturierte Daten: Data Warehouses speichern vorwiegend strukturierte Daten, die in Tabellenformaten organisiert sind.
- Schema-on-Write: Beim Importieren von Daten in ein Data Warehouse wird ein festes Schema angewendet, was bedeutet, dass die Datenstruktur vor dem Speichern der Daten definiert wird.
- Analyse und Berichterstattung: Sie sind optimiert für komplexe Abfragen und Analysen und eignen sich gut für Business Intelligence und Berichterstattung.
- Data Lake:
- Strukturierte und unstrukturierte Daten: Data Lakes können eine Vielzahl von Datenformaten speichern, einschließlich strukturierter, unstrukturierter und semi-strukturierter Daten.
- Schema-on-Read: Daten werden in ihrer rohen Form gespeichert, und das Schema wird erst angewendet, wenn die Daten gelesen werden, was eine größere Flexibilität bei der Datenanalyse bietet.
- Vielseitigkeit: Data Lakes eignen sich für Big Data-Anwendungen, maschinelles Lernen und Datenwissenschaft, da sie eine größere Vielfalt und Menge an Daten verarbeiten können.
Zusammengefasst sind Data Warehouses strukturierter und für vordefinierte Analysen optimiert, während Data Lakes eine breitere Palette von Datentypen speichern können und für flexible, explorative Datenanalysen geeignet sind.
Der Datenlebenszyklus mit Schwerpunkt auf dem Erstellungsprozess und den gewonnenen Erkenntnissen lässt sich in mehrere Phasen unterteilen:
- Datenerstellung (Creation): In dieser Phase werden Daten generiert oder erfasst. Dies kann durch verschiedene Mittel erfolgen, wie z.B. Datenerfassung durch Sensoren, Benutzereingaben oder Datensammlung aus verschiedenen Quellen.
- Datenspeicherung (Storage): Nach der Erstellung werden die Daten gespeichert. Dies kann in Datenbanken, Data Warehouses oder Data Lakes erfolgen, je nach Art und Zweck der Daten.
- Datenmanagement (Management): Hierbei werden die Daten organisiert, bereinigt und verwaltet, um ihre Qualität und Zugänglichkeit zu gewährleisten.
- Datenverarbeitung (Processing): In dieser Phase werden die Daten verarbeitet, was das Filtern, Sortieren und Transformieren der Daten umfasst, um sie für Analysen vorzubereiten.
- Datenanalyse (Analysis): Die Daten werden analysiert, um Muster, Trends und Einsichten zu identifizieren. Dies kann durch statistische Analysen, maschinelles Lernen oder andere Analysemethoden erfolgen.
- Erkenntnisgewinnung (Insights): In dieser Phase werden die Ergebnisse der Datenanalyse interpretiert, um nützliche Erkenntnisse zu gewinnen, die Entscheidungsfindung unterstützen oder neue Fragen aufwerfen können.
- Datenarchivierung und -löschung (Archiving/Deletion): Zum Abschluss des Lebenszyklus können Daten archiviert oder gelöscht werden, je nach gesetzlichen Bestimmungen und Relevanz der Daten.

