Die neue Schnittstelle für Ihr Data Warehouse in der Cloud im neuesten Data Quality Server
- Fehlertolerantes Matching mit FACT®
- Workflow-Prozesse bevor die Daten ins Data Warehouse gelangen
- Zusammenführen, anreichern und bereinigen für eine bessere Datenqualität
Neben den Schnittstellen zu salesforce.com, Microsoft Dynamics und SAP bieten wir ab sofort auch eine Schnittstelle zu Snowflake. Zahlreiche BI-Analysten verzweifeln täglich an der Qualität der Daten im Data Warehouse. Mit dem Data Quality Server können Sie endlich fehlertolerant „matchen“. Ist „Brinkenstoch GmbH“ gleich der „Brinckstoch GmbH“ an gleicher Adresse? Der Data Quality Server sagt es Ihnen und vergibt eine eindeutige ID. Zuverlässiger als alle Algorithmen, die heute auf der Plattform bereitstehen, schafft unser FACT®-Algorithmus eine Beziehung zwischen unterschiedlichen Daten.
Sie müssen eine Beziehung zwischen Ihren Daten herstellen
Fehlertolerates Matching macht aus Datenchaos logische Strukturen. Denn auch die angesagteste Cloud Anwendung bringt nichts, wenn Sie keine Beziehung zwischen den Daten aus ERP, CRM und Online Shop etc. herstellen können. Das typische Problem größerer Organisationen ist die Zahl der Quellsysteme und die nicht eindeutige Zuordnung von z.B. Kundennamen und Produkten. Mit dem patentierten FACT®-Algorithmus können Sie jedem Datensatz eine eindeutige ID zuordnen, diese kann dann in Snowflake übergreifend als Primary Key verwendet werden.
Verfügbar ist die neue Snowflake Schnittstelle ab Data Quality Server 2.26
Cloud alleine reicht nicht
Saubere Daten bevor es in die Cloud geht
Ihre Daten durchlaufen Workflows bevor sie in der Cloud landen. Daten werden vom Data Quality Server aus den Silos extrahiert, bereinigt, mit ID versehen und sauber in Snowflake abgelegt. Jetzt können die Daten aus Snowflake für Folgeprozesse wie Analysen genutzt werden.
Bereinigen und Zusammenführen, was bereits in der Cloud ist
Daten sind bereits in Snowflake abgelegt. Der Data Quality Server greift auf die benötigten Daten zu, bringt sie dublettenfrei zusammen, bereinigt Inhalte und ergänzt fehlende Informationen. Dann stellt er die Ergebnisse in einem eindeutigen Repository für die weitere Nutzung bereit.
Eindeutige Repositories im Live-Betrieb
Daten sind bereits in Snowflake abgelegt. Der Data Quality Server greift auf die benötigten Daten zu und erstellt in Snowflake saubere und eindeutige Repositories. Neu eintreffende Daten können direkt optimiert werden und fließen in die entsprechenden Datenabzüge.
Ein echter strategischer Vorteil
Vor allem die größten Unternehmen wollen mit ihren Daten in die Cloud. Ein Data Warehouse wie Snowflake lockt mit großen Versprechen. Dennoch ist die größte Herausforderung heute, die Bezüge zwischen den Daten aus unterschiedlichen Silos herzustellen, wenn kein eindeutiges und zuverlässiges Matching-Kriterium greifbar ist. Gleichzeitig müssen die Daten eines Silos sauber sein. Bei beiden Anforderungen hilft Ihnen der Data Quality Server:
- Bereinigen Sie Kundendaten und Produktdaten
- Stellen Sie Beziehungen zwischen den Daten her
- Reichern Sie Kundendaten mit Handelsregister-Daten und anderen Quellen an
- Richten Sie Workflows ein, die regeln, wie Daten in Snowflake und dem Zielsystem landen
„Wie macht man Fuzzy Matching in Snowflake?“
Eine häufig gestellte Frage von Snowflake-Anwendern ist, wie das Matching erfolgen kann. Die Antworten darauf sind häufig enttäuschend (https://stackoverflow.com/questions/73407672/how-to-do-fuzzy-match-in-snowflake-sql), denn die Levenstein-Methode und ähnliche Algorithmen produzieren schlechte Ergebnisse, die zu enormem manuellen Aufwand führen. FACT ist nicht nur die bessere Matching-Technologie, sondern nutzt zahlreiche Felder, um eine probabilistische Einschätzung der Ähnlichkeit (Score) zu ermitteln. Dieses Verfahren ist um Welten besser, wenn es darum geht, große Datenmengen abzugleichen.
Nutzen Sie FACT® für das Matching Ihrer Daten. Wir zeigen Ihnen gerne, welche Vorteile diese Art der eindeutigen Identifikation der Daten hat. Siemens, 1&1 und LG setzen hierfür auf die patentierte Omikron-Technologie.
Was ist der Data Quality Server?
Sie wollen die volle Kontrolle über die Qualität Ihrer Unternehmensdaten? Der Data Quality Server sorgt dafür, dass Ihre Unternehmensdaten jederzeit sauber und korrekt gehalten werden. Die Lösung führt Daten aus unterschiedlichen Silos zusammen, erkennt und entfernt Dubletten, bereinigt Adressen und stellt über 64 Workflows zur Datenbereinigung bereit. Mehr zum Data Quality Server erfahren Sie hier.