2. Ambienti di Test – gli approcci più diffusi
Uso dei dati di produzione per i test
• I dati sono voluminosi e contengono
informazioni sensibili.
Creazione dei dati di test
• Soluzione onerosa, soggetta ad
errori, e spesso basata su processi
manuali.
• I dati non sono comprensibili e
quindi poco usufruibili dagli utenti
finiali.
• I dati spesso non sono disponibili
quando il test lo richiede. Il 71% delle organizzazioni IT
• Scarsa qualità dei dati di test che utilizza dati di produzione per
può causare difficoltà nel ciclo di eseguire i propri test.
Research Report on 240 UK, French and German
QA. organizations, May 2008
3. Data Express, la soluzione di Micro Focus
• Genera un processo automatico per la
generazione di subset di dati
rappresentativi ed anonimizzati.
• Rispetta la referential integrity fisica e
logica anche tra diverse piattaforme.
• Promuove il controllo, la gestione e la
sicurezza dell'ambiente di test.
• Supporta la conformità alle norme
internazionali in materia di protezione dei
dati sensibili alla privacy.
• Fornisce inoltre strumenti di analisi fisica e logica dei dati e di
data change management.
4. Il processo di implementazione
Unload & extract
production data
1 into a common
Relational Databases format Analyse,
Hierarchical Databases
2 inventory & Load into test
classify data 5 environment
Sequential Files
Knowledge
Data Subset Base
Extraction Rules
Referential
Model
Extract masked
4 data subset
Define test data
3 creation rules
Privacy Data
Masking Rules
5. Data Builder Module
• Inventario e catalogazione dei file in base a:
– Applicazione di appartenenza;
– Piattaforma e db (DB2, VSAM, Oracle…);
– Occupazione di memoria
– Strutture fisiche
• Analisi dei dati
Un processo di campionamento dei dati genera informazioni statistiche
circa il contenuto di ogni campo (impronta digitale) che consente:
– la classificazione dei metadati indipendentemente dalle loro
caratteristiche fisiche;
– ulteriori informazioni per la comprensione dell’applicazione
6. Analisi dei dati
La funzione fornisce informazioni statistiche sul contenuto di ogni campo,
mirando a:
– Rendere automatico e più sicuro il processo di classificazione dei
metadati;
– Fornire informazioni utilizzabili per la verifica della qualità dei dati.
7. Data Masking Module
• Il processo di mascheramento dati:
– E’ parametrico, automatico, ripetibile e irreversibile.
– Preserva il significato originale dell’informazione.
– Garantisce l’integrità tra gli archivi e l’univocità delle chiavi.
– Ricalcola eventuali codici di controllo (codice fiscale).
• La soluzione gestisce nativamente il mascheramentto di:
– Nomi, cognomi, ragioni sociali, indirizzi, numeri di telefono, codici
alfanumerici univoci, etc. etc.
• Exit routines facilmente personalizzabili.
– Vengono forniti modelli di routine adattabili a ulteriori esigenze
8. Data Subset Extraction Module
• Il processo di stralcio dei dati rispetta il modello relazionale
fisico e/o logico.
• Le regole di subsetting possono essere importate
direttamente da catalogo oppure definite attraverso il
modulo client.
• La simulazione dell’estrazione dati stima: B
– il tempo e la cpu necessari per l’estrazione reale. A
– la dimensione degli archivi di output.
– la % di riduzione tra ambienti source e target
• Un unico processo può generare dati ridotti e mascherati.
9. I benefici operazionali e di business
• Conformità alle normative
il Data Masking garantisce il rispetto della legge
sulla Privacy e di normative interne.
• Riduzione del time-to-market
80 - 90% di risparmio nell’elapsed time per la
generazione degli ambienti di test.
• Data Storage ridotti fino al 90%
il processo automatico della soluzione minimizza le risorse coinvolte,
riduce i costi relativi allo storage e ai MIPS/CPU.
• Riduzione dei rischi e incremento della qualità dei dati di Test
la soluzione produce ambienti di test coerenti e completi, assicurando
test più rigorosi e riducendo i rischi di inattività.
10. L’esperienza di SANTANDER: risultati e benefici
Generazione di ambienti di dati di pre-produzione ridotti e
mascherati:
• nel rispetto della legge sulla privacy.
• garantendo la referential integrity.
• assicurando la stessa qualità dei dati di produzione.
Ambienti di test notevolmente contenuti, ridotti da 9 TB a 300
GB per ambiente.
• I dati sono automaticamente estratti, ridotti e mascherati
dall’ambiente di produzione.
• L’intervento delle risorse è ridotto al monitoraggio del processo.
• Il risparmio dei MIPS è notevole grazie all’utilizzo degli indici
Ottimizzazione del processo di generazione dell’ambiente di
dati:
• Un giorno per un refresh totale. Risparmio del 80% di elapsed.
11. Il webinar, della durata di 20 minuti, è disponibile, previa registrazione,
a questo indirizzo:
http://online.microfocus.com/dataexpressIT