Die Datenaufbereitung und -bereinigung ist ein leidiges Thema!
Sie nimmt viel Zeit in Anspruch und doch muss man sie berücksichtigen, um seine Analysen durchführen und korrekte Ergebnisse in seinen Berichten liefern zu können.
Um diesen Aufwand für Rohdaten nur einmal betreiben zu müssen und dann nur noch automatisiert ablaufen zu lassen, kann InfoZoom mittels Kommandozeilen gesteuert und eingesetzt werden.
3. Beispielszenario
Automatisierung folgender Schritte
1.
Rohdaten in eine vordefinierte InfoZoom Vorlage importieren
2.
Rohdaten mittels vordefinierter Anfragen reinigen
3.
Mehrere Datenextrakte der „gereinigten“ Datei als CSV Dateien für den
Import in eine Datenbank abspeichern
Hinweis:
Vor dem Erstellen einer Kommandozeile, alle Schritte einmal manuell
durchführen!
•
InfoZoom Vorlage für Rohdaten erstellen inkl.
o Attributgruppen Struktur, Formeln, Analysewürfel, Anfragen
•
Reportausgabe
o Kann wahlweise in die Anfrage eingebaut werden
Mögliche Formate: Excel Tabelle, CSV Datei, TXT Datei , InfoZoom
Datei
3
5. Schritt 2
Anfragen für die Datenbereinigung erstellen
• z.B. alle Zeichen außer Zahlen aus Telefonnummern löschen
•
Oder Leerzeichen am Anfang und Ende löschen und Großschreibung
5
6. Schritt 3
Datenextrakte als CSV Dateien mittels Anfragen speichern
• Selektion vornehmen:
o
leere Datensätze für die Extrakte ausschließen
6
7. Schritt 4
Kommandozeilenparameter
•
Texteditor öffnen und Datei als *.cmd speichern
•
In der ersten Zeile, Pfad zur InfoZoom.exe auf „C“ aufrufen
•
InfoZoom im Hintergrund laufen lassen
o
Kommando: -invisible
•
Vordefinierte Vorlage öffnen
o
Name der Vorlage (bei Leerzeichen im Namen, muss dieser in
Anführungsstrichen gesetzt werden)
•
Rohdaten in zuvor geöffnete Vorlage importieren
o
Kommando: -insert -d ";" (-d = Delimiter, in Anführungsstrichen muss das
Trennzeichen eingegeben werden: Semikolon, Zirkumflex etc.)
•
Vordefinierte Anfragen ausführen
o
Kommando: -query „Name der Anfrage“(bei Leerzeichen im Namen, muss dieser
in Anführungsstrichen gesetzt werden)
•
Selektion als CSV speichern
o
Kommando: -saveObjectsAscsv , „ORGA URL.csv“ (Trennzeichen und Name der
CSV Datei)
•
InfoZoom im Hintergrund schließen
o
Kommando: -exit
7
8. Schritt 5
Kommandozeile zusammenfügen
InfoZoom.exe -invisible Sample_Data.fot
–insert –d „^“ Sample_Data.csv
–query Country_cleansing
-query Exclude_blank_Orga -saveObjectsAscsv , ORGA.csv
-query Exclude_Blank_URL -saveObjectsAscsv , „ORGA URL.csv“
-query Exclude_blank_Address -saveObjectsAscsv , „ORGA ADDRESS.csv“
-query Exclude_blank_Contact -saveObjectsAscsv , „ORGA CONTACT.csv“
-exit
Legende
Kommandos
Vorlagen- bzw. Anfragenamen
Rohdaten
Trennzeichen für neu erstellte CSV Dateien
Namen der neu erstellten CSV Dateien
8
9. Result
Kommandozeile im Texteditor
•
Alle Kommandos müssen in einer Zeile stehen ohne Zeilenumbrüche!
•
Mit Doppelklick auf die *.cmd Datei
DOS-Fenster zeigt ausgeführte Kommandos
•
•
wird die Kommandozeile gestartet
Ergebnis: Erstellte CSV Dateien
Vorbereitungszeit ohne Kommandozeile: ca. 4 Stunden
Vorbereitungszeit mit Kommandozeile: ca. 30 Minuten
9
10. InfoZoom Seminare
InfoZoom Online Seminare
• IZ50 InfoZoom Web-Starter-Seminar
• IZ51 InfoZoom Web-Expert-Seminar
o Übersicht aller Seminartermine finden Sie hier:
http://infozoom-online-training.de/content/infozoomonline-training-trainings.html
10