SlideShare une entreprise Scribd logo
1  sur  150
Télécharger pour lire hors ligne
Facoltà di Ingegneria
         Corso di laurea in Ingegneria Informatica


            Tesi di laurea Magistrale in

               Ingegneria Informatica


Validation and analysis of mobility models



          Relatore                        Candidato
    Prof. Luca Becchetti               Umberto Griffo
         Correlatore
  Prof. Leonardo Querzoni




                       A/A 2011/2012
Indice
Introduzione ..................................................................................................... 4

User Mobility.................................................................................................... 8
   1.1      Tecnologie................................................................................................................. 9
   1.2      Tracce di mobilità .................................................................................................. 12
       1.2.1       CRAWDAD ................................................................................................... 13
       1.2.2       SocioPattern ................................................................................................... 14
       1.2.3       SocialDIS ........................................................................................................ 17
       1.2.4       MACRO.......................................................................................................... 20

Mobility Models ............................................................................................. 27
   2.1      Individual mobility models .................................................................................. 29
       2.1.1       Random Walk (RW)...................................................................................... 29
       2.1.2       Random Waypoint (RWP) ........................................................................... 30
       2.1.3       Random Direction (RD) .............................................................................. 32
       2.1.4       Truncated Lèvi Walk (TLW) ....................................................................... 33
       2.1.5       Boundless Simulation Area (BD) ............................................................... 34
       2.1.6       Gauss-Markov (GM) .................................................................................... 36
       2.1.7       Probabilistic Random Walk (PRW)............................................................ 38
       2.1.8       Weighted Waypoint (WW) .......................................................................... 40
   2.2      Group mobility models ........................................................................................ 41
       2.2.1       Exponential Correlated Random ................................................................ 41
       2.2.2       Column ........................................................................................................... 41
       2.2.3       Nomadic Community ................................................................................... 42
       2.2.4       Pursue .............................................................................................................. 42
       2.2.5       Reference Point Group (RPG) ................................................................... 43

Grafi dinamici................................................................................................. 44
   3.1      Definizione del grafo dinamico dei contatti ...................................................... 44
   3.2      Definizione del grafo aggregato dei contatti ..................................................... 47
   3.3      Indicatori statistici/metriche................................................................................ 47
       3.3.1       Indicatori/metriche su grafo aggregato ..................................................... 47
       3.3.2       Indicatori/metriche su grafo dinamico ..................................................... 51


                                                                                                                                         2
3.4      Rappresentazioni di grafi dinamici...................................................................... 55
       3.4.1       Graph Exchange XML Format (GEXF) .................................................. 56
       3.4.2       Dynamic Network Format (DNF) ............................................................. 57

Sistema per l'analisi di grafi dinamici............................................................. 64
   4.1      Gephi Platform ...................................................................................................... 64
       4.1.1       Gephi Dynamic API ..................................................................................... 67
   4.2      DNF Dynamic ....................................................................................................... 68
   4.3      DNF Importer ....................................................................................................... 71
   4.4      Mobility Model Generator ................................................................................... 72
       4.4.1       Mobility Simulator......................................................................................... 72
       4.4.2       Random Waypoint Mobility Model Generator ........................................ 73
       4.4.3       Truncated Lèvi Walk Mobility Model Generator .................................... 74
   4.5      Indicatori statistici/Metriche ............................................................................... 76
       4.5.1       Weighted Clustering Coefficient e Strength ............................................. 76
       4.5.2       Flooding time ................................................................................................. 77
       4.5.3       Inter-contact time ed Intra-contact time ................................................... 79
       4.5.4       Conditional probability Distribution of link's existence ......................... 80
       4.5.5       Link's existence variability ........................................................................... 80
       4.5.6       Pearson correlation matrix........................................................................... 81
   4.6      Ulteriori script e riferimenti ................................................................................. 83

Validazione sperimentale dei modelli di mobilità .......................................... 84
   5.1      Comparazione con i dati dell'esperimento SocialDIS ..................................... 86
       5.1.1       Modelli nella loro formulazione originaria ................................................ 86
       5.1.2       Modelli con aree di simulazione scalate di un fattore 10 ...................... 103
   5.2      Comparazione con i dati dell'esperimento MACRO ..................................... 116
       5.2.1       Modelli nella loro formulazione originaria .............................................. 116
       5.2.2       Modelli con aree di simulazione scalate di un fattore 10 ...................... 130
   5.3      Sintesi dei risultati ottenuti ................................................................................. 141

Conclusioni .................................................................................................. 143
   6.1      Proposte di sviluppo future ............................................................................... 144

Bibliografia ................................................................................................... 147




                                                                                                                                   3
Introduzione
        I modelli di mobilità riproducono i movimenti di utenti mobili assegnando a
ciascuno di essi una posizione, una velocità ed un'accelerazione che cambiano nel
tempo. Nel lavoro svolto in questa tesi è stata condotta un'estesa analisi statistica
volta a indagare l'efficacia di due importanti modelli di mobilità nel riprodurre il
comportamento di tracce reali. A tale scopo è stato fatto uso di tracce di mobilità
raccolte in due esperimenti sociali svolti in due differenti contesti: l'esperimento
SocialDIS, svoltosi a partire dal 17/10/2011 al primo piano del Dipartimento di
Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza
Università di Roma, e l'esperimento NeonMACRO, effettuato il 20 Giugno 2012, in
occasione della mostra d'arte NEON, presso il museo d'arte contemporanea di Roma
MACRO.
        Tramite una piattaforma RFID-based sono stati tracciati i contatti di
prossimità tra persone in entrambi gli esperimenti. A partire da questi dati, sono stati
costruiti dei grafi dinamici che descrivono l'evoluzione temporale delle interazioni
sociali tra individui, usando un formalismo che consente di memorizzarli più
efficientemente di quanto fosse possibile in passato. Tale formalismo, ideato e
sviluppato in questo lavoro, permette una rappresentazione notevolmente compatta
ed efficiente in termini di occupazione di memoria e manipolabilità.
        Per analizzare l'efficacia dei modelli nel riprodurre tracce compatibili con il
reale comportamento di agenti mobili, si sono analizzati e confrontati i grafi dinamici,
ottenuti a partire dagli esperimenti sociali sopra citati, con quelli generati a partire dai
modelli di mobilità Random Waypoint e Truncated Lévy Walk. A tal fine sono stati
sviluppati diversi moduli software basati sul framework Gephi [11] (http://gephi.org),
in particolare per:
       simulare la dinamicità temporale del grafo dei contatti con elevate prestazioni,
        in termini di tempo di calcolo e quantità di memoria allocata;
       importare nella piattaforma Gephi grafi che adottano il nuovo formalismo di
        memorizzazione;




                                                                                          4
   generare grafi dinamici a partire dal Random Waypoint Mobility Model e dal
        Truncated Lévy Walk Mobility Model;
       misurare le proprietà statiche (Graph Density, Cluster Coefficient, Weighted
        Clustering Coefficient, Strength, Modularity) e dinamiche (Inter-Intra
        Contact Time, Conditional probability of link's existence, Link's existence
        variability, Matrix correlation) dei grafi dinamici da confrontare.


        I grafi dinamici costruiti sono stati analizzati sia in forma aggregata che in
forma dinamica, rispettivamente aggregando le interazioni a distanza ravvicinata per
intervalli di tempo che vanno dalle 2 ore (nel caso NeonMACRO) alle 12 ore (nel
caso SocialDIS), e valutando l'evoluzione dei contatti secondo per secondo.
        Le prime analisi condotte mostrano che nel caso SocialDIS tipicamente gli
individui hanno contatti di prossimità prevalentemente con altri individui con cui
hanno stretto un legame d'amicizia e raramente con altri individui sconosciuti,
mentre nel caso NeonMACRO le persone tendono a comunicare soprattutto con
quelle che appartengono alla stessa comitiva e sporadicamente con tutte le altre.
        Questo comportamento tipico degli individui, riscontrato negli esperimenti,
non viene catturato dai modelli di mobilità RWP e TLW i quali sono stati
opportunamente configurati per riprodurre in modo realistico il movimento delle
persone nei due differenti contesti. In particolare, una differenza fondamentale
emerge confrontando i risultati forniti dalle metriche statiche applicabili sui grafi
aggregati e dalle metriche dinamiche applicabili su quelli non aggregati. Gli agenti che
si muovono secondo questi due modelli di mobilità tendono a comunicare con quasi
tutti gli altri agenti e tendono a produrre intervalli tra contatti successivi che
mediamente risultano eccessivamente lunghi.
Successivamente si sono investigate importanti differenze temporali indotte dai
modelli e presenti anche nelle tracce reali. I modelli RWP e TLW mostrano inoltre
significative correlazioni spaziali tra contatti distinti, sia simulando quanto avviene in
SocialDIS che nel NeonMacro. Analizzando gli schemi delle comunicazioni in
SocialDIS si è riscontrato che la correlazione spaziale tra contatti distinti risulta
essere esigua, mentre risulta essere leggermente maggiore in NeonMACRO.
Infine, attraverso l'implementazione di un semplice protocollo di flooding si sono
investigate le proprietà diffusive dei grafi prodotti dalle tracce reali e le si sono


                                                                                        5
confrontate con quelle dei modelli. E' stato appurato che entrambi i modelli, proprio
per il fatto di generare un elevato numero di comunicazioni che coinvolgono quasi
tutti gli individui, falliscono nel rappresentare il comportamento diffusivo mostrato
dagli esperimenti SocialDIS e NeonMACRO. La totalità dei risultati statistici di
questo studio hanno permesso di chiarire quali sono i limiti dei modelli di mobilità
adottati nella sperimentazione, almeno nel tipo di scenari considerati, in modo da
comprendere quali possano essere le modifiche da apportare per ottenere dei modelli
più realistici.
La tesi è strutturata come segue:
        Capitolo 1: vengono illustrate quali tecnologie consentono la raccolta di
         tracce di mobilità nei casi reali, le più recenti tracce di mobilità collezionate e
         rese disponibili dal mondo accademico e quelle invece ottenute dagli
         esperimenti che sono stati condotti nell'ambito del lavoro di tesi.
    
        Capitolo 2: viene data la definizione dei dataset sintetici e i modelli di
         mobilità, fornendo di questi ultimi una classificazione e successivamente
         illustrando quelli più usati per riprodurre il comportamento di dispositivi
         mobili in reti ad hoc.
    
        Capitolo 3: viene data la definizione dei grafi dinamici dei contatti e come
         possono essere costruiti a partire dai dati collezionati nei casi reali e da quelli
         ottenuti nei casi simulati con i modelli di mobilità adottati. In seguito
         vengono definiti gli indicatori statistici/metriche che sono stati implementati
         per poter condurre l'analisi statistica (trattata nel Capitolo 5), le limitazioni del
         formato attualmente più utilizzato per la scrittura di grafi dinamici su file e il
         nuovo formato che è stato ideato per superarle.
    
        Capitolo 4: vengono presentati i moduli software sviluppati sulla piattaforma
         Gephi con lo scopo di simulare la dinamicità temporale del grafo dei contatti,
         importare grafi dinamici memorizzati secondo un nuovo formalismo,
         generare grafi dinamici a partire dai modelli di mobilità e calcolare gli
         indicatori statistici/metriche.


                                                                                            6

   Capitolo 5: vengono illustrati e motivati i risultati dell'analisi e validazione
    sperimentale condotta confrontando i comportamenti degli individui tracciati
    negli esperimenti SocialDIS e NeonMACRO, con i comportamenti degli
    individui i cui movimenti sono stati dettati dai modelli di mobilità Random
    Waypoint e Truncated Lévy Walk.

   Capitolo 6: vengono presentate le considerazioni finali e i possibili sviluppi
    futuri.




                                                                                  7
Capitolo 1

User Mobility
La crescente diffusione e popolarità di dispositivi equipaggiati con interfacce di rete
wireless, come ad esempio gli smartphone di ultima generazione, rende possibile
collezionare nuove sorgenti dati, che descrivono il movimento e comportamento di
individui nei più disparati ambienti e contesti. L'accesso a tali collezioni di dati,
permette di investigare sulle interazioni delle reti sociali e sull'evoluzione di processi
dinamici, come la diffusione di un'informazione, la formazione di un'opinione, o un
processo epidemico.
        Esistono due tipi di data set usati per valutare processi e protocolli applicabili
alle reti mobili: dataset empirici (o Empirical dataset), collezionati catturando i dati dai
comportamenti reali dei dispositivi mobili, ovvero memorizzando le reali tracce di
mobilità dei dispositivi mobili, o dataset sintetici (o Synthetic dataset), creati usando i
modelli di mobilità, che provano a riprodurre il comportamento dei dispositivi mobili
senza usare tracce di mobilità reali.
        I dati provenienti dal mondo reale consentono di capire gli schemi di
comportamento che gli esseri umani adottano nelle loro attività. Quando si vogliono
collezionare tali dati, le caratteristiche che interessa conoscere sono: posizione,
direzione, velocità e tempo di pausa. Esistono diverse tecnologie che permettono di
ottenere dati accurati sulle posizioni dei dispositivi, come i sensori GPS-based o
Radio-based, ed esistono gli accelerometri per catturare i valori di velocità, direzione
e tempo di pausa.
        Queste tecnologie possono essere classificate in base a quanto accuratamente
riescono ad individuare la posizione di un dispositivo. Ad esempio utilizzando le reti
cellulari GSM/UMTS, la posizione dell'utente può essere determinata tramite varie
tecniche che permettono la sua localizzazione con un errore di massimo 50-150m,
mentre con le tecnologie GPS, si arriva ad un errore massimo di 10-100m.



                                                                                          8
Esiste un approccio alternativo per collezionare dati sui movimenti degli
individui, basato solo sulla raccolta dei contatti che avvengono tra di loro. Vengono
dunque raccolte le tracce dei contatti al posto delle tracce di mobilità, omettendo tutti
i dati relativi a posizione, direzione, velocità e tempi di pausa, in modo da simulare
solo le comunicazioni tra dispositivi.
        Per quanto concerne il lavoro svolto in questa tesi, è trovato interessante
questo secondo approccio, ovvero collezionare dati generati da reti dinamiche di
contatti (o dynamic contact network), ossia grafi che rappresentano le interazioni
face-to-face o di prossimità tra individui. Catturando trace di mobilità, basate sui
contatti reali, si possono osservare i veri comportamenti di tali individui.
        Nei prossimi sottoparagrafi saranno illustrate, quali tecnologie consentono la
raccolta di tracce di mobilità nei casi reali, le più recenti tracce di mobilità raccolte e
rese disponibili dal mondo accademico e quelle invece ottenute dagli esperimenti che
sono stati condotti nell'ambito del lavoro di tesi.

1.1 Tecnologie
Collezionare dataset realistici e di grandi dimensioni su attività e interazioni umane è
un processo difficile e costoso. Al fine di costruire dataset empirici, ossia tracciare i
comportamenti umani, sono stati usati dispositivi mobili cellulari o smartphone,
laptop con schede di rete wireless e sensori wireless (ad esempio iMote), utilizzando
reti di comunicazione di tipo Bluetooth e WiFi [30],[31],[32].
        L'uso delle reti WiFi risulta essere, come dimostrato negli esperimenti
condotti dall'Università di Dartmouth [33] e da quella di San Diego [41] , inaccurato
nel costruire tracce di mobilità realistiche tra dispositivi mobili. Utilizzando la
tecnologia WiFi i dati sulle interazioni device-to-device vengono raccolti assumendo
che i dispositivi mobili, che entrano nel raggio di comunicazione dello stesso AP
(access point), possono comunicare direttamente tra di loro, ossia i contatti vengono
registrati al tempo in cui i due dispositivi condividono lo stesso AP.
        Sfortunatamente, questa assunzione non è realistica, perché due dispositivi
collegati allo stesso access point non è detto che siano uno nel raggio di copertura
dell'altro, e viceversa, possono essere nei rispettivi raggi di copertura e non
condividere lo stesso AP. In quest'ultimo caso l'interazione non viene registrata
rendendo i dati raccolti poco realistici.


                                                                                         9
Inoltre un'altra problematica relativa alla tecnologia Wifi consiste nel fatto
che i dispositivi non sono sempre situati nello stesso punto dove si trova il
proprietario, pertanto i dati ottenuti non esprimono sempre i comportamenti di
mobilità degli individui. La tecnologia Bluetooth, utilizzata nell'esperimento [34]
condotto presso l'università di Toronto, dove le tracce di mobilità sono state
collezionate da 20 cellulari distribuiti a gruppi di studenti, permette di collezionare
contatti senza che i dispositivi debbano essere nel raggio di comunicazione dell'AP,
ma allo stesso tempo richiede che il cellulare sia trasportato dai soggetti e che esso
abbia una batteria con un'autonomia sufficiente per la durata dell'intero esperimento.
        Se i cellulari vengono ricaricati, si possono condurre lunghi esperimenti, ma
ovviamente per essere ricaricato, il cellulare deve essere fermo e probabilmente
distante dal proprietario, ottenendo la stessa problematica illustrata per il caso WiFi.
Tracce di mobilità sono state collezionate anche con l'uso di sensori Intel iMote,
utilizzando sempre la tecnologia Bluetooth.
        Essi registrano un contatto quando un dispositivo Bluetooth qualsiasi (sia un
altro iMote che un PDA) entra nel suo raggio di copertura. Tramite questa tecnologia
sono state raccolte tracce di mobilità in contesti differenti [30], ad esempio durante la
conferenza IEEE INFOCOM 2005 di Miami [48], dove 41 iMote sono stati
trasportati dai partecipanti per 3 giorni, o presso un laboratorio di ricerca della
Università di Cambrige, dove sono stati registrati i comportamenti e le tracce di
mobilità di 12 studenti di dottorato.
        Utilizzando le tecnologie Bluetooth e Wifi si possono raccogliere dati che
rivelano proprietà strutturali e temporali di schemi di comportamento sociali, ma
oltre che per i problemi già illustrati, queste tecnologie non sono adatte a rilevare
contatti di prossimità (o face-to face) tra dispositivi, dal momento che possiedono
una risoluzione spaziale massima di 10 metri e temporale di 2-5 minuti che non ci
permette di stabilire se due individui comunicano uno di fronte all'altro a distanza
ravvicinata (ad esempio 1 metro).
        Tali limitazioni possono essere superate attraverso l'uso dei dispositivi RFID
(Radio Frequency Identification) [35],[65] RFID, una tecnologia per l'identificazione
automatica di oggetti, animali o persone, basata sulla capacità di memorizzazione di
dati da parte di particolari dispositivi elettronici (detti tag o transponder) e sulla
capacità di questi di rispondere "all'interrogazione" a distanza, da parte di appositi


                                                                                       10
apparati fissi o portatili chiamati reader a radiofrequenza, comunicando (o
aggiornando) le informazioni in essi contenute.
       I tag RFID sono dei dispositivi dalle piccole dimensioni, facilmente
indossabili da individui, che permettono di stabilire con accuratezza se questi sono in
prossimità l'uno dell'altro. Questo perché i dispositivi possono scambiarsi pacchetti
radio a bassa frequenza solo quando due persone si trovano ad una distanza che va
da 1 a 1.5 m e sono una di fronte all'altra, in quanto il corpo umano costituisce una
barriera a radio frequenze per la frequenza portante usata per la comunicazione.
       In tale contesto, la tecnologia RFID è stata adottata ed utilizzata dalla
piattaforma SocioPatterns (http://www.sociopatterns.org) [36], un framework sperimentale
RFID-based che permette di raccogliere dati sulle interazioni face-to-face tra
individui che interagiscono a distanza ravvicinata. Durante gli esperimenti
SocioPatterns [37],[38],[39],[40] i partecipanti indossano dei piccoli tag RFID.
       Quando gli individui indossano i tag continuamente vengono inviati pacchetti
dati in broadcast. Quando una relazione di prossimità (o contatto) viene rilevata, il
dispositivo invia un messaggio ad alta potenza. Questo pacchetto dati contiene un
time stamp, l'id della stazione (RFID reader) che lo ha ricevuto e l'id dei tag che
hanno partecipato nell'interazione. Il messaggio ricevuto dagli RFID reader,
posizionati in modo fisso nell'ambiente, viene memorizzano localmente dal reader ed
inoltrato ad un server centrale tramite rete LAN (Local Area Network), in modo da
processare le informazioni in modalità online o offline.
       I tag RFID e I reader RFID usati negli esperimenti SocioPatterns, e negli
esperimenti condotti nella tesi, sono stati creati ed ottenuti dal progetto OpenBeacon
(http://www.openbeacon.org/). In figura 1.1 viene mostrata l'immagine di un tag RFID.




                                                                                     11
Fig.1.1: Viene mostrato come si presenta un tag RFID.

1.2 Tracce di mobilità
Studiare le interazioni sociali di prossimità e gli schemi di comportamento tra
individui, analizzando tracce di mobilità reali, permette di fare luce su diversi
fenomeni studiati in varie aree di ricerca. A tal fine può risultare utile analizzare
collezioni di dati raccolte e rese disponibili dal mondo accademico, oppure, come è
stato fatto nel lavoro di tesi, condurre esperimenti dove vengono collezionate tracce
di contatti utilizzando una piattaforma RFID-based.
       Nei prossimi quattro sottoparagrafi saranno illustrati rispettivamente, i data
sets forniti dalla Community Resource for Archiving Wireless Data di Dartmouth
(CRAWDAD) [43], i data sets raccolti durante gli esperimenti SocioPatterns [36], i dati
collezionati nel progetto SocialDIS [44] presso il Dipartimento di Ingegneria
informatica automatica e gestionale Antonio Ruberti della Sapienza Università di
Roma, e quelli ottenuti nel progetto MACRO [45] svoltosi presso il museo d'arte
contemporanea di Roma MACRO. Questi ultimi due data set sono stati collezionati
utilizzando i dispositivi ottenuti dal progetto OpenBeacon (http://www.openbeacon.org/),



                                                                                     12
in collaborazione con il Wireless Sensor Network group [46] del Dipartimento di
Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza
Università di Roma.

1.2.1 CRAWDAD
La Community Resource for Archiving Wireless Data di Dartmouth (CRAWDAD) [43] è
un gruppo di ricerca, che ha costruito un repository (raggiungibile al seguente sito
http://crawdad.cs.dartmouth.edu/data.php), dove vengono fornite trace di mobilità
a chiunque lavori nell'ambito delle reti wireless o con dispositivi mobili.
Questa raccolta contiene decine di dataset, ma solo quelli che descriveremo
raccolgono tracce di contatti, utili per l'analisi della mobilità di individui.


Cambridge/Haggle
Nell'articolo [48] è stato descritto un esperimento che ha coinvolto 41 partecipanti
presso la conferenza INFOCOM 2005 a Miami. Nello studio è stato mostrato che le
distribuzioni degli intervalli di tempo durante il quali due nodi possono comunicare,
hanno un andamento di tipo power-law. Per collezionare le tracce di contatti è stata
utilizzata la tecnologia Bluetooth, di cui sono forniti i dispositivi Intel iMote.
        Tali dispositivi, costituiti da un processore ARM, una radio Bluetooth e una
memoria flash, sono stati confezionati e distribuiti a volontari, che si sono impegnati
a trasportarli durante il loro spostamenti per tutta la durata della conferenza. Le
tracce dei contatti degli individui sono state collezionate eseguendo la procedura di
inquiry, ossia l'identificazione, da parte di un dispositivo, dei vicini che si trovano nel
suo raggio di copertura.
        Lo stato di inquiry dura cinque secondi, dopo i quali il dispositivo entra in
modalità standby per 120 secondi, più ±12 secondi, valore scelto estraendo un
numero casuale da una distribuzione uniforme. Il numero di secondi casuali serve ad
evitare che due dispositivi possano eseguire l'inquiry simultaneamente senza riuscire a
vedersi l'uno con l'altro. Quando viene rilevato un contatto, vengono registrati gli
indirizzi MAC dei due dispositivi che hanno comunicato, il tempo in cui avviene
l'interazione e il tempo in cui la comunicazione termina.




                                                                                        13
MIT/Reality Mining
Nathan Eagle nell'articolo [49], per ottenere gli indirizzi MAC di cellulari Bluetooth
ha sviluppato l'applicazione BlueAware, un software che registra i timestamp e gli
indirizzi MAC dei dispositivi che si trovano in prossimità l'uno dell'altro, nello
specifico di 60 cellulari con sistema operativo Symbian.
        L'applicazione riceve dal dispositivo Bluedar, un cellulare posizionato
nell'ambiente di studio che scansiona tutti i dispositivi visibili nel raggio di 25m, gli
indirizzi MAC, attraverso una rete 802.11b. L'esperimento Reality Mining ha
collezionato dati da 100 smartphone Nokia 6600 per nove mesi, scaricabili sia dal
repository del CRAWDAD, sia dal sito del progetto (http://reality.media.mit.edu).

1.2.2 SocioPattern
La Piattaforma RFID-based SocioPatterns ha collezionato tracce di mobilità,
disponibili sul sito web http://www.sociopatterns.org/dataset/, in diversi ambienti e
contesti. Bisogna tenere presente, che la piattaforma SocioPatterns non effettua un
tracciamento delle traiettorie e delle localizzazioni spaziali accurato, ma si focalizza
sul raccogliere accuratamente i contatti di prossimità tra individui, basandosi sulle
proprietà topologiche e temporali della mobilità dei nodi. Questa piattaforma rileva e
registra i contatti tra nodi solo attraverso lo scambio di pacchetti dati a bassa potenza,
come descritto nel paragrafo 1.2.


Infectious SocioPatterns dynamic contact networks.
        All'esibizione scientifica Infectus: Stay Away presso la Science Gallery di Dublino,
Irlanda, dal 17 aprile al 17 giugno 2009, dove hanno partecipato circa 30000
visitatori, vengono mostrate opere artistiche raffiguranti i meccanismi di contagio di
un virus. In questa occasione è stato collezionato un dataset contenente le reti
dinamiche di contatti giornaliere.
        Dal listato 1.1, si osserva che ciascun file è costituito da righe nella forma
“𝑡 𝑖 𝑗“, dove 𝑖 e 𝑗 sono gli ID anonimi delle persone che sono entrate in contatto, e
l'intervallo durante il quale il contatto è attivo è [ 𝑡 − 20𝑠, 𝑡 ]. Se in un dato
intervallo ci sono più contatti attivi, nel file verranno viste più righe che cominciano
con lo stesso valore di 𝑡. Il tempo è misurato in secondi ed espresso nel formato
UNIX time. Questo dataset è la controparte dinamica della rete di contatti aggregata


                                                                                         14
giornalmente, disponibile in formato GML (Graph Modelling Language) [48], un
formato di file di testo che rappresenta grafi con una sintassi veramente semplice.
Nel listato 1.2 ne viene fornito un semplice esempio, dove si definisce un grafo
costituito da tre nodi A, B e C collegati da due archi che collegano B ad A e C ad A.


Primary school.
        In una scuola elementare a Lione, Francia, dal 1 al 2 Ottobre 2009, sono stati
raccolti dati sulle interazioni face-to-face tra 232 bambini e 10 insegnanti distribuiti in
10 aule. I dataset comprendono due reti pesate di contatti avvenuti tra studenti ed
insegnati, ciascuna per ognuno dei due giorni. Ciascuna rete di contatti giornaliera è
costituita da: i nodi, che sono gli individui e gli archi, che rappresentano le interazioni
face-to-face.
        I nodi hanno un attributo che indica la classe di appartenenza dell'individuo,
ad esempio gli insegnanti hanno assegnato il valore "Teacher". Gli archi tra il nodo A
e il nodo B hanno due pesi associati: durata, che è il tempo totale per cui A e B
hanno avuto un contatto durante una singola giornata, misurato in secondi;
contatore, che è il numero di volte che il contatto tra A e B è avvenuto durante una
giornata scolastica.
        Le reti sono scaricabili come due file GEXF (Graph Exchange XML Format,
http://gexf.net/), uno per ogni giorno di raccolta. Questo formato sarà descritto in
modo più approfondito nel capitolo 3, quando verrà illustrato un nuovo formalismo
ideato e sviluppato nel lavoro di tesi.


Hypertext 2009 dynamic contact network.
        Alla ventesima edizione della ACM Conference on Hypertext and Hypermedia
(HT09) a Torino, dal 29 giugno al 1 luglio 2009, dove il team del SocioPatterns
project ha installato l'applicazione Live Social Semantics [39]. I partecipanti alla
conferenza hanno volontariamente indossato dei radio badge che monitorano i loro
contatti di prossimità. Il dataset pubblicato sul sito del progetto, che rappresenta la
rete dinamica di contatti di ~110 partecipanti, è costituito da due file:
   Contact List: è una lista separata da tabulazioni che rappresenta i contatti attivi
    durati intervalli di 20 secondi. Ciascuna riga del file ha la forma “𝑡 𝑖 𝑗“, dove 𝑖 e 𝑗
    sono gli ID anonimi delle persone che sono entrate in contatto, e l'intervallo


                                                                                        15
durante il quale il contatto è attivo è [ 𝑡 − 20𝑠, 𝑡 ]. Se in un dato intervallo ci
        sono più contatti attivi, nel file verranno viste più righe che cominciano con lo
        steso valore di 𝑡. Il tempo è misurato in secondi ed espresso nel formato UNIX
        time.
       Contact Intervals: è un file in formato JSON (http://www.json.org/) che contiene
        un dizionario, dove ciascuna chiave è l'ID di una persona e il corrispondente
        valore è il dizionario dei vicini di quella persona. Il dizionario dei vicini ha una
        chiave con l'ID della persona e per ogni chiave, il valore relativo è la lista di
        intervalli temporali durante i quali il corrispondente contatto è attivo. Nel listato
        1.3 viene mostrato un esempio.

1240913019         78577671        77922321
1240913019         78577671        96403467
1240913019         77922321        96403467
1240913039         78577671        77922321
1240913039         77922321        96403467
1240913059         78577671        77922321
1240913059         77922321        96403467
1240913079         78577671        77922321
1240913079         77922321        96403467
1240913099         96403467        77922321
1240913099         96403467        78577671
1240913099         77922321        78577671
1240913179         77922321        96403467

Listato.1.1: Viene mostrato un frammento del file contenente la lista di contatti
dinamici del 28/04/2009, collezionati durante l'esibisione Infectus: Stay Away.

graph
[
    node
    [
     id A
    ]
    node
    [
     id B
    ]
    node
    [
     id C
    ]
     edge
    [



                                                                                          16
source B
     target A
    ]
    edge
    [
     source C
     target A
    ]
]

Listato.1.2: Questo semplice codice mostra come definire un grafo di tre nodi e due
archi.


"1144": {
           "1336": [[203800, 203820]],
           "1214": [[192300, 192320], [192400, 192420], [192500, 192600],
            "1215": [[207600, 207620]],
           "1155": [[181620, 181640]],
           "1204": [[194040, 194060]],
           "1149": [[44920, 44940], [54840, 54860], [86680, 86700 [88360, 88380]],
           "1228": [[100680, 100700]],
           "1191": [[195320, 195340]],
           "1360": [[106560, 106580], [106620, 106700], [146640, 146660]]
           },

Listato.1.3: Esempio rappresentazione di grafo dinamico tramite il formato JSON.
1144 è la chiave che identifica una persona. Il valore associato alla chiave contiene la
lista degli ID dei suoi vicini. Per ogni chiave rappresentante l'ID del vicino e
associato come valore la lista degli istanti temporali in cui c'è stato il corrispettivo
contatto.

1.2.3 SocialDIS
           Il primo esperimento che è stato condotto, chiamato da ora in poi SocialDIS,
si è svolto al primo piano del Dipartimento di Ingegneria informatica automatica e
gestionale Antonio Ruberti della Sapienza Università di Roma. A partire dal
17/10/2011 sono stati tracciati per quattro giorni, in modo assolutamente anonimo, i
movimenti e i contatti di prossimità tra gli studenti che si sono offerti volontari.
           Hanno aderito all'esperimento circa 120 studenti, che hanno indossato un tag
RFID attivo per tutta la durata della loro permanenza nel dipartimento. Come viene
mostrato in figura 1.2, sono stati installati 20 lettori RFID al primo piano
dell'edificio, distribuendoli in tutte le aule, nella segreteria, nella sala studio, nella



                                                                                       17
presidenza e nel dispaccio (stanza dove vengono venduti cibi e bevande agli
studenti).




Fig.1.2: La figura mostra come gli RFID reader, identificati dai pallini neri, siano
posizionati nelle in tutte le stanze e nei corridoi del primo piano del primo piano del
Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti
della Sapienza Università di Roma. I pallini azzurri identificano gli studenti che si
trovano in prossimità dei lettori di tag RFID ad un determinato istante temporale.


I tag RFID indossati dagli studenti, periodicamente diffondono in broadcast
pacchetti radio a bassa frequenza contenenti informazioni riguardo, la loro posizione
e i contatti ravvicinati che hanno con uno o più individui. I dispositivi, che sono stati
fatti indossare agli individui, sono stati sviluppati dal progetto OpenBeacon
(http://www.openbeacon.org).
        Quando un tag RFID rileva un contatto con un altro tag, ossia due studenti si
trovano uno di fronte all'altro ad una distanza che va da 1 a 1.5 m, invia un
messaggio ad alta potenza verso il reader più vicino. Questo pacchetto dati contiene
un time stamp, l'id del reader che lo ha ricevuto e l'id dei tag che hanno partecipato
nell'interazione. Il messaggio ricevuto dai reader viene memorizzato localmente ed
inoltrato tramite rete LAN (Local Area Network) ad un server centrale, che
colleziona e memorizza i dati, processabili successivamente offline. Alla fine

                                                                                      18
dell'esperimento è stato collezionato un dataset di 250 MB, contenente tutte le
interazioni avvenute durante l'esperimento, visualizzabili sotto forma di grafo pesato
in figura 1.3.




Fig.1.3: Vengono mostrate le interazioni sociali tra gli studenti durante l'esperimento
SocialDIS. La grandezza e il colore di un nodo indica il numero di vicini. I nodi
piccoli e verdi hanno poche relazioni con gli altri nodi, mentre quelli grandi e blu
hanno tante relazioni con gli altri nodi. Lo spessore dell'arco indica quanto
frequentemente due persone interagiscono. Un arco sottile indica poche interazioni
tra due persone, mentre un arco spesso indica che ci sono state molte interazioni tra
due persone.




                                                                                    19
Nel grafo ciascun nodo rappresenta un visitatore e ciascun arco rappresenta il
contatto avvenuto tra due individui. La grandezza ed il colore di ciascun nodo e il
peso ed il colore di ciascun arco rappresentano la rispettiva frequenza, ossia il
rapporto tra il numero di secondi in cui esso esiste e la durata totale dell'esperimento.
        Un esempio di informazione che si può ottenere da tale dataset è: Il tag con
id xxxx ha incontrato il tag con id yyyy nella stanza Alpha oppure il tag con id xxxx è
vicino alla stanza Beta. In alcun modo possiamo risalire alla vera identità della
persona a cui è associato il tag con id xxxx.
Inoltre a ciascun studente è stato chiesto di fornirci le seguenti informazioni
personali in forma anonima:
       Età
       Sesso (maschio/femmina)
       Status (corso di studi e anno accademico)
        Con le trace di contatto che sono state ottenute dall'esperimento possiamo
analizzare le relazioni tra individui: analizzare gli spazi condivisi (aule, corridoi,
segreteria), analizzare le relazioni tra studenti, ad esempio individuando la formazione
di comunità o cluster.
        Nel capitolo 5 si vedrà, utilizzando le metriche definite e descritte nel capitolo
3, se i modelli di mobilità (descritti nel capitolo 2) generano grafi dinamici, con
proprietà topologiche e temporali vicine a quelle possedute dal grafo dinamico
ottenuto dal dataset empirico relativo all'esperimento condotto.
        Per quanto concerne il tracciamento della mobilità degli studenti, precisiamo
che, non effettuiamo un tracciamento delle traiettorie e delle localizzazioni spaziali
accurato, ma raccogliamo solamente i contatti di prossimità tra individui. Possiamo
solamente conoscere la posizione dello studente, ossia in che stanza o corridoio si
trova, in base a quale lettore RFID riceve il segnale ad alta potenza inviato dal tag.

1.2.4 MACRO
Il 20 Giugno 2012 è stato effettuato un secondo esperimento simile a SocialDIS,
presso il museo d'arte contemporanea di Roma MACRO, chiamato da ora in poi
NeonMACRO. Durante la mostra d'arte NEON, sono stati tracciati in modo
completamente anonimo i movimenti dei visitatori (ad esempio, quale opera un



                                                                                         20
visitatore sta guardando e per quanto tempo), i contatti di prossimità tra i visitatori
che hanno accettato di partecipare all'esperimento.
        I circa 120 visitatori aderenti all'iniziativa, hanno indossato un tag RFID
attivo per tutta la durata della loro visita nella sala Enel del museo. Come viene
mostrato in figura 1.4, sono stati installati 8 lettori RFID nella sala espositiva,
posizionandoli vicino le opere d'arte principali. I tag RFID indossati dai visitatori,
come nell'esperimento SocialDIS, periodicamente diffondono in broadcast pacchetti
radio a bassa frequenza contenenti informazioni riguardo, la loro posizione e i
contatti ravvicinati che hanno con uno o più soggetti. Anche in questo caso, i
dispositivi sono stati ottenuti dal progetto OpenBeacon (http://www.openbeacon.org).




Fig.1.4: La figura mostra come gli RFID reader, identificati dai pallini neri, siano
posizionati le opere d'arte esibite al museo d'arte contemporanea di Roma MACRO.




                                                                                       21
Quando due visitatori si trovano uno di fronte all'altro ad una distanza che va
da 1 a 1.5 m, il rispettivo tag indossato rileva il contatto ed invia un messaggio ad alta
potenza verso il reader più vicino. Il pacchetto dati inviato, contiene un time stamp,
l'id del reader che lo ha ricevuto e l'id dei tag che hanno partecipato nell'interazione.
        Il messaggio ricevuto dai reader viene, anche questa volta, memorizzato
localmente ed inoltrato tramite rete LAN (Local Area Network) ad un server
centrale, collocato in quella che viene chiamata "Area", un open space del museo
dove i visitatori possono rilassarsi, conoscere altre persone e condividere idee.
         Il server colleziona e memorizza i dati, che saranno successivamente
processati ed analizzati offline. Alla termine dell'esperimento è stato raccolto un
dataset di 10 MB. In figura 1.5 possiamo visualizzare, sottoforma di grafo pesato,
tutte le interazioni tra visitatori avvenute durante l'esperimento.




Fig.1.5: Vengono mostrate le interazioni sociali tra le persone durante l'esperimento
NeonMACRO. I visitatori più sociali sono rappresentati da cerchi grandi e di colore
scuro. Lo spessore degli archi dipende dalla frequenza con cui avviene l'interazione
tra due visitatori.

                                                                                       22
Ciascun nodo rappresenta un visitatore e ciascun arco rappresenta il contatto
avvenuto tra due individui. La grandezza di ciascun nodo e il peso di ciascun arco
rappresentano la rispettiva frequenza, ossia il rapporto tra il numero di secondi in cui
esso esiste e la durata totale dell'esperimento.
        Questo permette di visualizzare immediatamente nel grafo quali siano i
visitatori più socievoli e quelli meno socievoli. A ciascun visitatore è stato chiesto di
fornire le seguenti informazioni in forma anonima:
       Età
       Sesso (maschio/femmina)
       Titolo di studio
       Area professionale
       Nazionalità (Italiano o non Italiano)
       Gruppo (se un visitatore è entrato nella sala accompagnato da altre persone, a
        ciascun membro del gruppo viene associato l'identificativo del gruppo )

        La raccolta di queste ulteriori informazioni ha permesso di effettuare delle
semplici ed immediate analisi sul comportamento dei visitatori. In figura 1.6 si
possono visualizzare le interazioni tra gruppi di visitatori. In figura 1.7 si può
osservare, il grafo pesato rappresentante tutte le interazioni tra i visitatori (classificati
per età) e le opere d'arte, mentre in figura 1.8 il grafo pesato raffigura tutte le
interazioni tra i visitatori (classificati per titolo di studio) e le opere d'arte.
        Nel capitolo 5 si vedrà, utilizzando le metriche definite e descritte nel capitolo
2, se i modelli di mobilità (descritti nel capitolo 2) generano grafi dinamici, con
proprietà topologiche e temporali vicine a quelle possedute dal grafo dinamico
ottenuto dal dataset empirico relativo all'esperimento condotto.
        Anche in questo caso il tracciamento della mobilità dei visitatori, non
raccoglie le traiettorie e le localizzazioni spaziali in maniera accurata, ma raccoglie
solamente i contatti di prossimità tra individui. Si possono solamente conoscere la
posizione del visitatore, ossia in che posizione della sala Enel si trova (o che opera
d'arte stia guardando), in base a quale lettore RFID riceve il segnale ad alta potenza
inviato dal tag indossato.




                                                                                          23
Fig.1.6: Il grafo mostra le interazioni fra i gruppi di visitatori. Ciascun nodo
rappresenta un gruppo costituito dalle persone entrate in sala accompagnate.




                                                                               24
Fig.1.7: Il grafo mostra le interazioni tra i visitatori e le opere d'arte. I pallini scuri e
grandi rappresentano le opere d'arte, mentre i pallini colorati più piccoli
rappresentano i visitatori, che sono stati classificati in base alla loro età, compresa tra
0-9, 10-19, 20-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80 e più anni.




                                                                                          25
Fig.1.8: Il grafo mostra le interazioni tra i visitatori e le opere d'arte. I pallini scuri e
grandi rappresentano le opere d'arte, mentre i pallini colorati più piccoli
rappresentano i visitatori, che sono stati classificati in base al titolo di studio (Master,
Bachelor, High School, Ph.D., Primary School e Mid School).
    




                                                                                          26
Capitolo 2

Mobility Models
        Nel precedente capitolo sono state descritte le tecnologie con le quali
vengono collezionati i dataset empirici, ossia dati che mostrano i comportamenti reali
dei dispositivi mobili (nel nostro caso tag RFID). In questo capitolo verrà definito
cosa sono invece i dataset sintetici (o Synthetic dataset), dati generati usando i modelli di
mobilità, ed saranno illistrativi modelli che tentano di riprodurre il comportamento
dei dispositivi mobili, senza usare tracce di mobilità reali.
        I Synthetic data sono secondo il McGraw-Hill Dictionary of Scientific and
Technical Terms [12] "qualunque raccolta di dati applicabile a una data situazione,
che non sia ottenibile tramite una misurazione diretta". Catturare i movimenti di
individui (o nodi mobili) permette di osservare gli schemi di comportamento presenti
in sistemi di vita reale. Il processo di tracciamento però, è un'operazione difficile da
fare quando viene coinvolto un gran numero di persone e l'osservazione viene
eseguita per lunghi periodi di tempo.
I protocolli e le applicazioni per le reti mobili non sono facilmente modellabili e le
loro performance non sono facilmente valutabili se non si conoscono i movimenti
degli individui, che verranno chiamati da ora user trace. Se si vogliono produrre delle
user trace senza ricorrere a complesse infrastrutture per collezionare i dati (ad esempio
la piattaforma SocioPatters illustrata nel capitolo 1), è necessario utilizzare i synthetic
models. I Synthetic models rappresentano realisticamente il comportamento di nodi
mobili senza aver bisogno di catturare user trace dal mondo reale.
Tracy Camp nell'articolo [13] presenta diversi modelli di mobilità, che sono stati
utilizzati per valutare le performance di protocolli per reti ad hoc. L'autore enfatizza
il bisogno di sviluppare modelli di mobilità accurati per rappresentare realisticamente
i movimenti di utenti mobili, esplorando le limitazioni delle strategie adottate dai
modelli attualmente utilizzati. Egli classifica i modelli di mobilità in due tipi: individual
mobility models e group mobility models.

                                                                                          27
Gli Individual mobility models o memoryless models [14],[15] descrivono nodi le cui
azioni sono indipendenti l'uno dall'altro. Questi semplici modelli sono i più usati per
valutare reti mobili wireless, in cui ogni dispositivo è indipendente dagli altri e quindi
non esistono correlazioni nei comportamenti.
        I group mobility models [16],[17],[18] sono invece più complessi e meno utilizzati,
e rappresentano il comportamento di nodi dipendenti l'uno dall'altro. Nei prossimi
paragrafi saranno decritti i seguenti Individual mobility models, i più famosi ed utilizzati
nel simulare il comportamento delle reti mobili ad hoc:
    1. Random Walk Mobility Model: modello in cui i nodi mobili seguono direzioni
        casuali con velocità scelte in modo casuale.
    2. Random Waypoint Mobility Model: modello che tiene conto di un tempo di
        pausa, prima che il nodo cambi direzione e velocità.
    3. Random Direction Mobility Model: modello in cui i nodi mobili devono arrivare
        alla fine dell'area di simulazione prima di poter cambiare la direzione e la
        velocità.
    4. Truncated Lévy Walk Mobility Model: modello dove le human walks del caso reale
        sono approssimate con quelle che vengono chiamate, Lévy walks.
    5. Boudless Simulation Area Mobility Model: modello che trasforma l'area di
        simulazione da rettangolare 2D a forma toroidale.
    6. Gauss-Markov Mobility Model: modello in cui gli schemi di mobilità possono
        essere resi più o meno casuali regolando un parametro.
    7. Versione probabilistica del Random Walk Mobility Model: modello che utilizza un
        insieme di probabilità per determinare la prossima posizione di un nodo
        mobile.
    8. Weighted Waypoint Mobility Model: modello in cui i nodi mobili scelgono la
        propria destinazione secondo una certa probabilità, che dipende dalla
        posizione corrente, dal tempo e dalla "popolarità" della zona da raggiungere.
Illustreremo anche i seguenti group mobility models:
    1. Exponential Correlated Random Mobility Model: modello dove i movimenti
        seguono una funzione di movimento.
    2. Column Mobility Model: modello dove un insieme di nodi forma una linea che si
        muove uniformemente lungo una specifica direzione.



                                                                                         28
3. Nomadic Community Mobility Model: modello dove un insieme di nodi si muove
        da un luogo ad un altro, mantenendo una certa libertà di movimento
        all'interno del gruppo.
    4. Pursue Mobility Model: modello dove un insieme di nodi insegue un
        determinato nodo.
    5. Reference Point Group Mobility Model: modello dove i movimenti delle comunità
        sono basati sul percorso che attraversa un centro logico.

2.1 Individual mobility models
Verrano descritti ora i modelli di mobilità in cui ciascun nodo ha un comportamento
indipendente rispetto a quello degli altri nodi.

2.1.1 Random Walk (RW)
Il Random Walk Mobility Model è stato ideato ed illustrato per la prima volta da
Einstein nel 1926 [50]. Il modello si basa sul moto browniano, ossia sul movimento
disordinato e casuale delle particelle (aventi diametro dell'ordine del micrometro)
presenti in fluidi o sospensioni fluide. In questo modello di mobilità, viene
inizialmente definita un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 ed il numero
totale di nodi 𝑁.
        Ciascun nodo si muove dalla sua posizione corrente alla sua posizione
successiva scegliendo casualmente una direzione e una velocità con cui viaggiare. Il
valore della velocità viene scelto da una distribuzione e può essere compreso tra un
valore minimo e un valore massimo 𝑠𝑝𝑒𝑒𝑑𝑚𝑖𝑛, 𝑠𝑝𝑒𝑒𝑑𝑚𝑎𝑥 . Anche la direzione
viene scelta casualmente da una distribuzione uniforme con valori compresi tra
0, 2𝜋 .
        Ogni passo di simulazione termina dopo un tempo prestabilito t o dopo una
certa distanza d, alla fine delle quali ciascun nodo sceglie una nuova direzione e
velocità. Del Random Walk Mobility Model sono state derivate altre versioni, chiamate
d-D walks, dove d rappresenta il numero di dimensioni dell'area di simulazione.
Quello che abbiamo descritto è la versione 2-D. Questo modello è memoryless perché
non tiene traccia della posizione e della velocità passata dei nodi mobili. La velocità e
la direzione correnti di un nodo mobile, sono indipendenti da quelle passate. In



                                                                                      29
figura 2.1 (ottenuta dal sito http://paginas.fe.up.pt/~ee03058/stat_art.html) osserviamo
che questa caratteristica può generare movimenti umani irrealistici.




Fig.2.1: Esempio di come si muove un nodo mobile usando il Random Walk
Mobility Model versione 2-D.


Se il tempo 𝑡 o la distanza 𝑑, che definiscono quanto dura un passo della
simulazione, sono troppo corti, i nodi si muovono solo in una piccola parte dell'area
di simulazione, generando uno schema di movimento adatto all'analisi di reti semi
statiche. Pertanto se si vogliono invece analizzare reti dinamiche, dobbiamo scegliere
grandi valori per 𝑡 e 𝑑.

2.1.2 Random Waypoint (RWP)
Uno dei modelli di mobilità più popolari ed utilizzati è il Random Waypoint model
(RWP). Questo modello di mobilità è un semplice modello stocastico che descrive
come si muovono i nodi in una rete mobile in una data area. In questo modello di
mobilità viene definita un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 e stabilito il
numero totale di nodi 𝑁. Ciascun nodo viene casualmente posizionato nell'area in un
punto (𝑥, 𝑦), dove 𝑥 e 𝑦 sono entrambi uniformemente distribuiti rispettivamente su
0, 𝑋 𝑚𝑎𝑥 e 0, 𝑌 𝑚𝑎𝑥 . A ciascun nodo vengono assegnati un punto di arrivo o
destinazione (𝑥0 , 𝑦0 ), casualmente scelto tra i punti dell'area, e una velocità v, che è



                                                                                       30
casualmente scelta da una distribuzione uniforme in un intervallo compreso tra
  𝑚𝑖𝑛𝑠𝑝𝑒𝑒𝑑, 𝑚𝑎𝑥𝑠𝑝𝑒𝑒𝑑 . Un nodo inizia a muoversi verso la destinazione con
velocità v. Arrivato al punto di arrivo (𝑥0 , 𝑦0 ), il nodo rimane li per un tempo p,
chiamato waiting time, che è casualmente scelto da una distribuzione uniforme.
Terminato il waiting time, vengono scelte una nuova destinazione e una nuova velocità
nello stesso modo e il processo si ripete fino a che non termina la simulazione.
        In figura 2.2 (ottenuta dal sito http://www.emeraldinsight.com) come il
comportamento di un nodo in un area di simulazione che misura 1000 x 1000 m.




Fig.2.2: Esempio di come si muove un nodo mobile usando il Random Waypoint
Mobility Model in un'area 1000 x 1000 m.


Se al modello si assegna a ciascun nodo un waiting time pari a zero e
  𝑚𝑖𝑛𝑠𝑝𝑒𝑒𝑑, 𝑚𝑎𝑥𝑠𝑝𝑒𝑒𝑑           =   𝑠𝑝𝑒𝑒𝑑𝑚𝑖𝑛, 𝑠𝑝𝑒𝑒𝑑𝑚𝑎𝑥 , il Random Waypoint
Mobility Model diventa simile al Random Walk Mobility Model. Il modello presenta
il seguente problema [13]: ciascun nodo mobile viene posizionato in modo casuale
nell'area di simulazione, non rappresentando in modo realistico il modo in cui i nodi
si distribuiscono quando si muovono. In [13] viene mostrato che nel modello si
attenua il problema della posizione iniziale dopo circa 600 secondi di simulazione e
che esistono tre possibili soluzioni per evitare l'inaccuratezza del modello, dovuta alla
posizione iniziale dei nodi.
        La prima soluzione è salvare le posizioni dei nodi al termine di una
simulazione durata più di 600 secondi ed utilizzarle come posizioni iniziali nelle

                                                                                      31
simulazioni successive. La seconda è scegliere la posizione iniziale secondo una
distribuzione di probabilità che rappresenta meglio la realtà che vogliamo simulare.
La terza consiste nello scartare i primi 1000 secondi di simulazione. La terza
soluzione è migliore della prima, perché garantisce che ciascuna simulazione abbia un
inizializzazione esente dal problema appena trattato.
       Nel Random Waypoint Mobility Model esiste una correlazione tra la velocità
e il tempo di pausa di un nodo. Ad esempio, se nella simulazione i nodi percorrono
l'area a velocità elevate ed hanno dei tempi di pausa lunghi, vengono prodotte reti più
stabili rispetto al caso in cui, i nodi si muovono lentamente e aspettano poco tempo.
       La distribuzione spaziale dei nodi incide sul numero di vicini che essi
possono avere, perché i nodi che sono vicini al bordo dell'area di simulazione, hanno
maggiore probabilità di scegliere una destinazione che si trovi verso il centro
dell'area, dove la probabilità di incontrare nodi cresce, mentre quando si trovano sul
bordo dell'area la probabilità di incontrare nodi decresce. Queste variazioni di densità
(chiamate density wave) del numero medio di vicini in base alla zona, vengono risolte
nel modello descritto nel prossimo paragrafo.

2.1.3 Random Direction (RD)
Il Random Direction Mobility Model (RD)descritto in [52], è stato ideato per evitare le
variazioni del numero medio di vicini che si hanno in base alla zona dell'area di
simulazione raggiunta da un nodo mobile, che avvengono nel modello RWP. I
quest'ultimo modello è stato visto che la probabilità con cui un nodo sceglie una
nuova destinazione localizzata nel centro dell'area di simulazione, o che richiede
l'attraversamento di essa, è alta. Pertanto il modello RD cerca di evitare il più
possibile di diminuire questa probabilità, facendo in modo che i nodi si trovino con
maggiore probabilità vicino i bordi dell'area di simulazione.
        Come visto modello precedentemente illustrato, anche ora viene definita
un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 ed il numero totale di nodi 𝑁.
Ciascun nodo viene casualmente posizionato nell'area in un punto (𝑥, 𝑦), dove 𝑥 e 𝑦
sono entrambi uniformemente distribuiti rispettivamente su 0, 𝑋 𝑚𝑎𝑥 e 0, 𝑌 𝑚𝑎𝑥 .
       A ciascun nodo viene assegnata una velocità v, casualmente scelta da una
distribuzione uniforme in un intervallo compreso tra      𝑚𝑖𝑛𝑣, 𝑚𝑎𝑥𝑣 e un angolo di
direzione, scelto casualmente da una distribuzione uniforme con valori compresi tra


                                                                                     32
0, 2𝜋 , come avviene nel modello RW. Ciascun nodo dopo aver scelto la direzione,
la segue fino ad arrivare al bordo dell'area di simulazione con velocità 𝑣.
        Quando un nodo raggiunge il bordo si ferma per un tempo chiamato waiting
time, casualmente scelto da una distribuzione uniforme. Terminato il waiting time,
vengono scelte una nuova destinazione e una nuova velocità nello stesso modo e il
processo si ripete fino a che non termina la simulazione.
        Dato che i nodi restano per molto tempo sui bordi dell'area di simulazione, la
distanza media tra i nodi risulta maggiore rispetto agli altri modelli, per questo
motivo un pacchetto dati o un informazione, raggiunge un nodo attraversando un
numero medio di hop maggiore rispetto agli altri modelli. Dunque la rete ottenuta
dalla simulazione risulta partizionata.
        Per diminuire tale problema, è stata ideata una versione modificata del
modello RD, descritta in [51], in cui i nodi mobili continuano a scegliere casualmente
una direzione, ma non devono raggiungere necessariamente il bordo dell'area di
simulazione affinchè si fermino ed aspettino il waiting time, per poi ripartire per una
nuova direzione. Questa modifica rende il modello RD identico al modello RW con il
waiting time.

2.1.4 Truncated Lèvi Walk (TLW)
        Gli schemi di mobilità degli esseri umani vengono tipicamente approssimati
con il modello RW (descritto nel paragrafo 2.1.1) o RWP (illustrato nel paragrafo
2.1.2). Attraverso delle misurazioni fatte in natura si è osservato che le traiettorie
seguite dagli animali sono approssimabili a un Lévy flight [19], definito da Schlesinger
[60], come il più lungo viaggio che una particella segue in linea retta, da un luogo ad
un altro, senza cambiare direzione o tempo di pausa.
        Queste osservazioni sono state poi generalizzate al caso umano nello studio
descritto in [20], dove, catturando tramite tecnologia GPS le user trace di 44
volontari distribuiti in diversi ambienti outdoor (campus universitari, metropolitane,
parchi), si è riscontrato che le human walks hanno delle forti correlazioni statistiche
con le Lévy walks. Gli autori enfatizzato il fatto che le somiglianze possono essere
solo di tipo statistico, perché gli umani si muovono in base all'attività che devono
svolgere o alle loro preferenze, dunque non possono spostarsi in modo casuale.




                                                                                     33
In figura 2.5 si nota che, le Lévy walks [20] sono un insieme di tanti flight corti
e rari flight lunghi e che le tracce di mobilità risultano essere più realistiche di quelle
ottenute dai modelli di mobilità RW e RWP.
        Nello studio è stato scoperto che, le flight distribution e le waiting time distribution
dei partecipanti all'esperimento, sono truncated power-law distribution, e che la Inter contac
time (ITC) distribution delle human walk mostra un comportamento di tipo power-law
[22].




Fig.2.5: Esempio di user trace ottenuta da (a) Levy walks, (b) RWP e (c) RW.


Usando tali risultati, Hong in [21] ha sviluppato il Truncated Levy Walk model (TLW),
ossia una variante del modello RWP (illustrato nel paragrafo 2.1.2), con le seguenti
caratteristiche:
       Le lunghezze dei flight seguono una truncated power law con esponente 𝛼:
                   − 1+𝛼
         𝑝 𝑙 ~ 𝑙           ,𝑙< 𝑙   𝑚𝑎𝑥 ;

       i waiting times seguono una truncated power law con esponente                         𝛽:
         𝜓 𝑡 ~𝑡 − 1+𝛽 , 0 < 𝑡 < 𝑡 𝑚𝑎𝑥 ;
       l'angolo di direzione segue una distribuzione uniforme compresa tra 0,2𝜋 ;
       la velocità cresce in modo proporzionale rispetto lunghezza del flight;

2.1.5 Boundless Simulation Area (BD)
        Il Boundless Simulation Area Mobility Model, non è memoryless, ossia esiste una
relazione tra la direzione e la velocità di un nodo nel tempo passato e la direzione e
velocità del nodo correnti [55]. Definita un area'rettangolare di dimensione 𝑋 𝑚𝑎𝑥 ×
 𝑌 𝑚𝑎𝑥 ed il numero totale di nodi 𝑁, la velocità di un nodo mobile è descritta da un
vettore 𝑣 = 𝑣, 𝜃 , dove v è la velocità e 𝜃 è la direzione. Ciascun nodo viene

                                                                                             34
casualmente posizionato nell'area in un punto (𝑥, 𝑦). Ad ogni passo della
simulazione, di durata ∆𝑡, la velocità e la posizione di ogni nodo viene aggiornata
secondo le seguenti equazioni:
                    𝑣 𝑡 + ∆𝑡 = 𝑚𝑖𝑛 𝑚𝑎𝑥 𝑣 𝑡 + ∆𝑣, 0 , 𝑉𝑚𝑎𝑥
                                 𝜃 𝑡 + ∆𝑡 = 𝜃 𝑡 + ∆𝜃
                          𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + 𝑣 𝑡 ∗ 𝑐𝑜𝑠𝜃 𝑡
                          𝑦 𝑡 + ∆𝑡 = 𝑦 𝑡 + 𝑣 𝑡 ∗ 𝑠𝑖𝑛𝜃 𝑡
dove 𝑉𝑚𝑎𝑥 è la massima velocità definita nella simulazione, ∆𝑣 è la variazione di
velocità che è uniformemente distribuita tra −𝐴        𝑚𝑎𝑥   ∗ ∆𝑡, 𝐴   𝑚𝑎𝑥   ∗ ∆𝑡 , 𝐴   𝑚𝑎𝑥   è la
massima accelerazione che può raggiungere un nodo, ∆𝜃 è la variazione di direzione
che è uniformemente distribuita tra −𝛼 ∗ ∆𝑡, 𝛼 ∗ ∆𝑡 , e 𝛼 è la massima variazione di
angolo nella direzione percorsa dal nodo. Dalla figura 2.3 (ottenuta dal sito web
http://www-public.it-sudparis.eu/~gauthier/MobilityModel/mobilitymodel.html) si osserva che
a differenza dei modelli illustrati nei paragrafi precedenti, i nodi possono continuare il
loro percorso superando i confini dell'area di simulazione, riapparendo nel lato
opposto dell'area di simulazione.




                                                                                               35
Fig.2.3: Esempio di come si muove un nodo mobile, che parte dal punto
(≅390,≅290), usando il Boundless Simulation Area Mobility Model in un area di
1000 x 300 m.


In figura 2.4 si vede che questa tecnica crea un area di simulazione toroidale, dove i
nodi possono viaggiare senza confini.




Fig.2.4: La figura mostra che nel Boundless Simulation Area Mobility Model l'area di
simulazione di forma rettangolare, viene trasformata in una forma toroidale.



2.1.6 Gauss-Markov (GM)
        Il Gauss-Markov Mobility Model è stato implementato in [56]. A ciascun nodo,
che si muove in un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 , viene assegnata
una velocità e una direzione iniziale, che viene aggiornata ad ogni intervallo di tempo
fisso 𝑛. Il valore aggiornato nell'n-esima istanza è calcolato in base al valore della n-1
esima istanza, e al valore di una variabile casuale, usando le seguenti equazioni:


                      𝑠 𝑛 = 𝛼𝑠 𝑛−1 + 1 − 𝛼 𝑠 +       1 − 𝛼 2 𝑠 𝑥 𝑛 −1

                     𝑑 𝑛 = 𝛼𝑑 𝑛−1 + 1 − 𝛼 𝑑 +         1 − 𝛼 2 𝑑 𝑥 𝑛 −1


dove 𝑠 𝑛 e 𝑑 𝑛 sono, rispettivamente la nuova velocità e la nuova direzione dei nodi
nell'intervallo temporale 𝑛; 𝛼, compresa tra −1, 1 , è usata come parametro per
regolare la casualità; 𝑠 e 𝑑 sono costanti che rappresentano il valore medio di velocità


                                                                                       36
e direzione con 𝑛 → ∞; 𝑠 𝑥 𝑛 −1 e 𝑑 𝑥 𝑛 −1 sono variabili aleatorie prese da una
distribuzione Gaussiana.
       Impostando 𝛼 = 0 otteniamo valori totalmente casuali, mentre con 𝛼 = 1
otteniamo un moto lineare. Assegnando valori intermedi ad 𝛼, si ottengono diversi
livelli di casualità. Ad ogni passo della simulazione la posizione successiva di un nodo
viene calcolata in base alla posizione, velocità e direzione corrente, seguendo le
seguenti equazioni:
                             𝑥 𝑛 = 𝑥 𝑛−1 + 𝑠 𝑛−1 ∗ 𝑐𝑜𝑠𝑑 𝑛−1
                             𝑦 𝑛 = 𝑦 𝑛−1 + 𝑠 𝑛−1 ∗ 𝑠𝑖𝑛𝑑 𝑛−1


Dove      𝑥 𝑛 , 𝑦 𝑛 𝑒 𝑥 𝑛−1 , 𝑦 𝑛−1 sono rispettivamente le coordinate x e y dei nodi
mobili all'n-esimo e all'n-1 esimo intervallo temporale.
       In figura 2.5 (dal sito ottenuta dal sito web http://tinyurl.com/8oed5jz) viene
mostrato il comportamento di un nodo in un area di simulazione che misura 700 x
1000 m.




Fig.2.5: Esempio di come si muove un nodo mobile, che parte dal punto
(≅500,≅500), usando il Gauss-Markov Mobility Model in un area di 700 x 1000 m.



                                                                                     37
2.1.7 Probabilistic Random Walk (PRW)
Nella tesi di dottorato di Chiang [57] è stato creato un modello di mobilità, chiamato
Probabilistic Random Walk Mobility Model, che, utilizzando una matrice di probabilità,
determina la posizione di uno specifico nodo mobile, in un'area 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 , in
base a tre possibili stati: lo stato 0 rappresenta la posizione corrente, lo stato 1
rappresenta la posizione passata e lo stato 2 rappresenta la posizione futura se il nodo
mobile continua a muoversi nella stessa direzione.
        La matrice di probabilità usata e la seguente:


                                𝑃(0,0)       𝑃(0,1)      𝑃(0,2)
                            𝑃 = 𝑃(1,0)       𝑃(1,1)      𝑃(1,2)
                                𝑃(2,0)       𝑃(2,1)      𝑃(2,2)


Dove ciascun valore 𝑃(𝑎, 𝑏) rappresenta la probabilità che un nodo mobile passi
dallo stato 𝑎 allo stato 𝑏. Le coordinate x e y di ciascun nodo vengono aggiornate in
base ai valori della matrice. Ogni nodo si muove casualmente con una velocità media
predefinita. Nella seguente matrice ci sono i valori che Chiang ha usato per calcolare
le variazioni nelle coordinate x e y dei nodi:


                                       0 0.5 0.5
                                  𝑃 = 0.3 0.7 0
                                      0.3 0 0.7


In figura 2.6 possiamo vedere la matrice illustrata sotto forma di diagramma di flusso.
Per come è configurata la matrice di probabilità, un nodo mobile può andare diretto
verso: nord, sud, est o ovest, senza mai prendersi una pausa (wait time = 0). La
probabilità che il nodo continui a seguire la stessa direzione è più alta della
probabilità che esso la cambi. Inoltre i valori definiti non permettono movimenti tra
la precedente e la prossima posizione senza passare per quella corrente.




                                                                                     38
Fig.2.6: Diagramma di flusso della versione probabilistica del Random Walk Mobility
Model.


Questa implementazione del modello produce dei comportamenti di mobilità più
realistici del modello RW. Ad esempio una persona che deve eseguire vari compiti
giornalieri, tende a muoversi seguendo una direzione semi costante.
         Raramente gira improvvisamente intorno a dove era, tornando sui suoi passi,
e quasi mai si muove casualmente sperando eventualmente di finire in uno dei posti
che gli interessano. In figura 2.7 (ottenuta dal sito ottenuta dal sito web http://www-
public.it-sudparis.eu/~gauthier/MobilityModel/mobilitymodel.html)   viene   illustrato   un
esempio di schema di mobilità di un nodo mobile usando la versione probabilistica
del modello RW. Da questa figura si osserva che la user trace ha dei cambiamenti di
direzione molto meno variabili di quelli visti per il modello RW in figura 2.1, dunque
approssima meglio gli schemi di mobilità degli esseri umani.




                                                                                         39
Fig.2.7: Esempio di come si muove un nodo mobile, che parte dal punto
(≅500,≅500), usando il Probabilistic Random Walk Mobility Model in un area di 500
x 560 m.

2.1.8 Weighted Waypoint (WW)
Il Weighted Waypoint Mobility Model (WW) [64] è una versione del modello RWP, in cui
le persone non decidono una destinazione in modo casuale, ma la scelgono in base
ad una certa probabilità, che dipende da quanto gli individui tendono a visitarla. Tutti
i modelli che sono stati illustrati nei paragrafi precedenti non considerano che
all'interno dell'area di simulazione alcune zone sono visitate più spesso rispetto ad
altre.
         In [64] è stato dimostrato che se ne viene tenuto conto, ossia si considera
l'esistenza di zone in cui gli individui interagiscono tra di loro per un periodo
prolungato, si possono ottenere delle user trace più accurate rispetto al modello RWP.
I modelli WW ed RWP si differenziano per :
    1. Le persone non scelgono casualmente la destinazione: a ciascuna zona
         dell'area di simulazione viene assegnato un peso, definito in base alla
         probabilità di scegliere quel luogo come destinazione. Tale probabilità può



                                                                                     40
essere calcolata valutando quanto le zone siano "popolari" nell'ambiente che
        stiamo tentando di simulare.
    2. La probabilità di scegliere una specifica zona come prossima destinazione,
        dipende dalla posizione corrente e dal tempo: viene usato un modello
        Markoviano per assegnare tali probabilità.
    3. Il waiting time in ciascuna zona, è diverso e dipende dalle proprietà specifiche
        del luogo.

2.2 Group mobility models
Verranno descritti ora i modelli di mobilità in cui i nodi hanno un comportamento
che dipende da quello degli altri nodi. Tali modelli risultano essere utili per tracciare
user trace che simulano realtà in cui i nodi si muovono in comunità.

2.2.1 Exponential Correlated Random
Questo modello di mobilità proposto in [58] data la posizione di un nodo (o un
gruppo) al tempo 𝑡, tramite funzione di movimento 𝑏 𝑡 , viene determinata la
posizione successiva del nodo (o gruppo) al tempo 𝑡 + 1, con la seguente funzione:
                                           1                   1
                                          −
                       𝑏 𝑡 + 1 = 𝑏(𝑡) 𝑒     𝜏
                                                + 𝜎   1 − (𝑒 − 𝜏 )2 𝑟
dove r è una variabile casuale che segue una distribuzione Gaussiana che ha varianza
𝜎, e 𝜏 regola la velocità di cambiamento del nodo dalla posizione precedente a quella
successiva (ad una valore minore di 𝜏 corrisponde un cambiamento più rapido). Il
problema principale di questo particolare modello è la difficoltà di assegnare il valore
più corretto ai parametri in modo da ottenere lo schema di mobilità che vogliamo.

2.2.2 Column
Il Column Mobility Model (http://www.disca.upv.es/misan/mobmodel.htm) è un modello che
rappresenta un insieme di nodi mobili che si muovono lungo una data linea (o
colonna). Inizialmente viene definita una reference grid, ossia una colonna iniziale di
nodi, dove ciascun nodo viene messo in relazione con un punto di riferimento. I
nodi si possono muovere attorno al loro punto di riferimento seguendo le regole
dettate da un particolare Individual mobility models (ad esempio viene consigliato di




                                                                                      41
usare il modello RW, descritto nel paragrafo 2.1.1). Il nuovo reference point per un
determinato nodo viene definito come:
               𝑛𝑒𝑤 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐     𝑒 𝑝𝑜𝑖𝑛𝑡   = 𝑜𝑙𝑑 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐   𝑒 𝑝𝑜𝑖𝑛𝑡   + 𝑎𝑑𝑣𝑎𝑛𝑐𝑒 𝑣𝑒𝑐𝑡𝑜𝑟

dove 𝑜𝑙𝑑 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐   𝑒 𝑝𝑜𝑖𝑛𝑡   è il punto di riferimento precedente e 𝑎𝑑𝑣𝑎𝑛𝑐𝑒 𝑣𝑒𝑐𝑡𝑜𝑟 un
offset angolare scelto in modo casuale che sposta la griglia di riferimento. Quando la
griglia viene ruotata con un angolo casuale (compreso tra 0 e 𝜋) e spostata ad una
distanza casuale, i nodi mobili, che si muovono seguendo il loro punto di riferimento,
seguono la griglia e continuano la loro rotazione attorno al punto.

2.2.3 Nomadic Community
Il Nomadic Community Mobility Model (http://www.disca.upv.es/misan/mobmodel.htm) è un
modello che rappresenta comunità di nodi che si muovono collettivamente da un
punto ad un altro [59]. Ogni comunità o gruppo di nodi, che ha associato un punto
di riferimento in comune, si muove attorno al proprio reference point ma, all'interno di
ogni gruppo, ciascun nodo mantiene una propria "area personale", dove si muove in
modo casuale. Questo modello può essere usato ad esempio per simulare scenari
dove una classe di studenti visitano un museo d'arte. Gli alunni della classe si
sposteranno da un punto ad un altro insieme, mentre nel punto in cui si trovano si
possono muovere individualmente come vogliono (ad esempio secondo un Individual
mobility models). Rispetto al modello Column, i nodi all'interno del gruppo sono meno
vincolati nella possibilità di movimento.

2.2.4 Pursue
Nel Pursue Mobility Model definito in (http://www.disca.upv.es/misan/mobmodel.htm) e in
[59], uno dei nodi della rete viene selezionato come nodo target. Il nodo prescelto,
che si muove secondo uno degli Individual mobility models, viene seguito dagli altri nodi
mobili, eseguendo dei movimenti in direzione di esso, determinati da un
randomvector , ossia un offset ottenuto seguendo uno degli Individual mobility models
(ad esempio il modello RW, descritto nel paragrafo 2.1.1). La nuova posizione di
ciascun nodo viene calcolata utilizzando la seguente equazione:


newposition = oldposition + acceleration target − oldposition                    + randomvector



                                                                                             42
dove acceleration target − oldposition       è l'informazione relativa al nodo che viene
inseguito e randomvector rappresenta l'offset applicato ad ogni nodo.
Dunque, per calcolare la prossima posizione di ogni nodo, questo modello utilizza la
posizione corrente del nodo, un vettore casuale e il valore dell'accelerazione relativa
al nodo inseguito.

2.2.5 Reference Point Group (RPG)
           Il Reference Point Group Mobility Model (RPG) definito in [58] rappresenta il
movimento casuale di un gruppo di nodi mobili. Gli spostamenti del gruppo si
basano sul percorso seguito da quello che è definito il centro logico del gruppo. Il
centro logico del gruppo viene utilizzato per calcolare i movimenti del gruppo
attraverso un group motion vector, 𝐺 𝑀, che può essere predefinito o scelto in modo
casuale.
           Ogni nodo si muove casualmente seguendo il proprio reference point pre-
definito, il cui spostamenti dipendono dal movimento del gruppo. Quando di un
nodo viene calcolato un nuovo reference point al tempo 𝑡 + 1, 𝑅𝑃(𝑡 + 1), questo
viene combinato con un random vector, 𝑅 𝑀, per rappresentare lo spostamento
casuale di ogni nodo rispetto al relativo reference point.
           Dunque, il vettore 𝑅 𝑀 viene usato per calcolare il nuovo reference point di
ogni nodo al tempo t+1. Successivamente la nuova posizione di ogni nodo viene
stabilita sommando il random motion vector, 𝑅 𝑀, al nuovo reference point.




                                                                                     43
Capitolo 3

Grafi dinamici
        Nel presente lavoro sono state generate reti dinamiche di contatti (che
saranno chiamate da ora in poi Dynamic Contact Network o Contact Graph), ricavate sia
da tracce di contatti basate su quello che è avvenuto negli esperimenti SocialDIS e
MACRO, sia da tracce di contatti ottenute a partire dai modelli di mobilità. Nei
seguenti paragrafi verrà descritto: come si definisce un Contact Graph a partire dai casi
reali e dai casi simulati usando modelli di mobilità; gli indicatori statistici definiti ed
implementati per poter analizzare e confrontare le Dynamic Contact Network; le
limitazioni del formato attualmente più utilizzato per la scrittura di grafi dinamici su
file e il nuovo formato che è stato ideato per superarle.

3.1 Definizione del grafo dinamico dei contatti
L'evoluzione dinamica di una rete, può essere modellata introducendo la dimensione
temporale 𝑡, che mostra come la topologia della rete varia nel tempo. Nelle
opportunistic networks, un Contact Graph 𝐺(𝑉, 𝐸) è tipicamente usato per descrivere
una rete dinamica di contatti [8]. In un Contact Graph: 𝑉 è l'insieme di nodi ed 𝐸 è
l'insieme degli archi, dove ciascun arco è rappresentato da, una coppia di nodi, dal
tempo in cui il contatto è iniziato e dalla durata del contatto.
        Basandosi su questa definizione fornita da Ferreira [8], viene ridefinito il
Contact Graph come una rete 𝐺(𝑉, 𝐸), in cui ciascun nodo 𝑣 ∈ 𝑉, rappresenta una
persona e ciascun arco 𝑒 ∈ 𝐸, rappresenta un contatto face-to-face avvenuto tra due
individui. Sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 l'insieme di tutti gli istanti temporali in cui il grafo
varia nel tempo.
        Ad ogni nodo e ogni arco viene associato un Presence Schedule, un insieme
contenente gli istanti di tempo 𝑡 ∈ 𝑇, in cui il nodo (o arco) è presente. Il Presence




                                                                                          44
Schedule di un nodo 𝑣 può essere rappresentato come 𝑃(𝑣), e il Presence Schedule di un
arco 𝑒 può essere rappresentato come 𝑃(𝑒).
        A partire da un caso reale (ad esempio gli esperimenti SocialDIS e MACRO),
si può facilmente costruire il Contact Graph dalla traccia di contatti collezionata (come
viene descritto nei paragrafi 1.2.3 e 1.2.4), generando un nodo ogni volta che un tag
RFID viene rilevato per la prima volta da un reader RFID, assegnandogli ciascuna
volta il tempo in cui è stato rilevato (in formato UNIX time) e generando un arco
ogni volta che due individui si trovano uno di fronte all'altro ad una distanza
ravvicinata.
        Quando questo accade, viene aggiornato il 𝑃(𝑣) di ciascun 𝑣 ∈ 𝑉 che ha
partecipato nell'interazione e il 𝑃 𝑒 dell'arco 𝑒 ∈ 𝐸 che li connette. Infatti, il tag
RFID indossato dagli individui, quando rileva la comunicazione, invia un messaggio
ad alta potenza verso il reader RFID più vicino. Tale mesaggio contiene il tempo in
cui il contatto è avvenuto (in formato UNIX time) e l'id dei tag che hanno
comunicato. Il peso di ciascun arco del Dynamic Contact Graph ottenuto, è pari alla
frequenza con cui il contatto avviene, ossia il rapporto tra 𝑃 𝑒      e 𝑇.
        A partire dai modelli di mobilità, se si vogliono rilevare i contatti di
prossimità tra persone, ciascuna delle quali ha una propria posizione, direzione,
velocità e tempo di pausa, bisogna considerare che ogni individuo possa vederne un
altro, entro un raggio limitato di visibilità.
        Un intersection graph [61] è un grafo formato a partire da una famiglia di insiemi
𝑆 𝑖 , con 𝑖 = 0,1,2, … , 𝑛, creando un vertice 𝑣 𝑖 per ogni insieme 𝑆 𝑖 e connettendo due
vertici 𝑣 𝑖 e 𝑣 𝑗 con un arco quando i relativi insiemi hanno un'intersezione non nulla,
ovvero 𝑒 =       𝑣 𝑖 , 𝑣 𝑗 |𝑆 𝑖 ∩ 𝑆𝑗 ≠ 0.
        Come è possibile vedere in figura 3.1, uno unit disk graph [62] è un intersection
graph costituito da un vertice per ogni cerchio e da un arco ogni volta che due cerchi
s'intersecano. Ciascun cerchio, definito nel piano Euclideo, ha la stessa misura.
Utilizzando il principio su cui si basa la costruzione dello unit disk graph, viene
costruito il Contac Graph come segue: Siano A e B due individui che si muovono
secondo un modello di mobilità, sia (𝑥 𝑎, 𝑦 𝑎 ) la posizione di A e (𝑥 𝑏, 𝑦 𝑏 ) la posizione
di B. Siano 𝑟 𝑎 e 𝑟 𝑏 i rispettivi raggi dei cerchi di A e B.
Definite le seguenti grandezze:


                                                                                         45
𝑥 𝑑𝑖𝑓𝑓 = 𝑥 𝑎, − 𝑥 𝑏,
                                    𝑦 𝑑𝑖𝑓𝑓 = 𝑦 𝑎, − 𝑦 𝑏,
                          𝐷𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑠𝑞𝑢𝑎𝑟𝑒𝑑 = 𝑥 𝑑𝑖𝑓𝑓 2 + 𝑦 𝑑𝑖𝑓𝑓 2


le persone A e B, che si muovono secondo le regole del modello di mobilità, hanno
un contatto se 𝐷𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑠𝑞𝑢𝑎𝑟𝑒𝑑 < 𝑟 𝑎 + 𝑟 𝑏 2 .




Fig.3.1: Esempio di unit disk graph, dove tra due nodi esiste un arco che li
congiunge, se e solo se i rispettivi cerchi s'intersecano.


Se in ogni istante di simulazione applichiamo questa verifica ad ogni coppia di nodi,
ogni volta che viene rilevato un contatto, assegniamo al Presence Schedule, di ciascun
nodo e dell'arco che li congiunge, il tempo in cui la comunicazione è avvenuta,
ottenendo in questo modo un Contact Graph 𝐺(𝑉, 𝐸). Il peso di ciascun arco 𝑒 ∈ 𝐸, è
pari alla frequenza con cui il contatto avviene, ovvero il rapporto tra 𝑃 𝑒   e 𝑇




                                                                                    46
3.2 Definizione del grafo aggregato dei contatti
I grafi dei contatti possono essere prodotti sia in forma aggregata, che in forma
dinamica. Sia 𝐺(𝑉, 𝐸), un Contact Graph e sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli
istanti temporali in cui 𝐺 varia nel tempo. Si ottiene un Contact Graph aggregato
rispetto un intervallo di tempo      𝑘1 , 𝑘2 , con 0 < 𝑘2 − 𝑘1 = K ≤ 𝑇, assegnado a
ciascun arco 𝑒 ∈ 𝐸 un peso pari alla frequenza con cui il contatto avviene, ovvero il
rapporto tra 𝑃 𝑒      e 𝐾, senza però associare alcun presence schedule ai nodi/archi del
grafo.

3.3 Indicatori statistici/metriche
Nei prossimi sotto-paragrafi verranno definiti gli indicatori statistici (o metriche) che
sono stati implementati per poter analizzare e confrontare le Dynamic Contact Network
ottenute sia, a partire da casi reali che da casi simulati usando i modelli di mobilità.
Tali indicatori (o metriche) si classificano in due tipi: metriche su grafo aggregato,
ossia indicatori che eseguono misure non considerando i Presence schedules, e metriche
su grafo dinamico , ovvero indicatori che effettuano misure considerando i Presence
schedules.

3.3.1 Indicatori/metriche su grafo aggregato
Node strength. La Strength [1] di un nodo i, definita come:
                                               𝑁

                                       𝑆𝑖 =         𝑤 𝑖,𝑗
                                              𝑗𝜖𝑉

dove V è l'insieme dei vicini del nodo, 𝑉 = 𝑁, 𝑤 𝑖,𝑗 è il peso dell'arco che connette
il nodo i al nodo j, misura la "forza" di un nodo in base alla somma dei pesi delle sue
connessioni. In un grafo pesato, la strength di un nodo è la somma dei pesi degli archi
incidenti al nodo; in-strength e out-strength sono definite per i grafi pesati diretti,
similarmente al in- e out-degree. In questo caso la strength è la frequenza attesa, con la
quale un nodo comunica con i suoi vicini.


Weighted Clustering Coefficient. Il clustering misura quanto i vicini di un nodo
tendono ad essere collegati tra di loro, ovvero quanto tendono con esso a formare
una clique (grafo completo).

                                                                                         47
Il local clustering di un nodo i è misurato con un coefficiente 𝐶 𝑖 , introdotto da
Watts e Strogatz per le analisi delle small-world networks [2], definito come rapporto tra il
numero attuale di archi tra il nodo i e i propri vicini e il numero massimo di archi che
connettono tra do loro i suoi vicini.
Pertanto è definita come:
                                                  2 𝑒𝑖
                                         𝐶𝑖 =
                                                𝑑𝑣(𝑑𝑣 − 1)
Dove dv è il degree del nodo i. Questa misura và calcolata solo per i nodi con 𝑑𝑣 >
1, perché per quelli con 𝑑𝑣 = 1 è pari a 0.
Il clustering coefficient del grafo è definito come la media di tutti i local cluster coefficient:
                                                  1
                                            𝐶 =               𝐶𝑖
                                                  𝑁
                                                       𝑖

In figura 3.2 si osserva che, nel caso di weighted graph, il semplice cluster coefficient può
sovrastimare la misura del clustering [2],[1], pertanto il local cluster coefficient viene
ridefinito come:
                                              2               𝑤 𝑖,𝑗 + 𝑤 𝑖,𝑘
                               𝐶𝑖 𝑊 =
                                        𝑆 𝑖 (𝑑𝑣 − 1)                2
                                                       𝑗 ,𝑘

Dove 𝑆 𝑖 è la Strength del nodo i, 𝑤 𝑖,𝑗 e 𝑤 𝑖,𝑘 sono rispettivamente i pesi degli archi che
connetto il nodo i ai suoi vicini j e k che sono tra di loro interconnessi.




Fig.3.2: Esempio che mette a confronto il valore del cluster coefficient, calcolato per il
nodo 𝑣, con la rispettiva versione pesata. In questo caso particolare, il nodo 𝑣 ha
comunicato con una frequenza maggiore, con il nodo 𝑗, dunque anche se 𝑣 fa parte




                                                                                                     48
di una 4-clique, ne fa meno parte rispetto al caso non pesato. 𝐶 𝑣 = 0.5 risulta essere
in questo caso una sovrastima rispetto a 𝐶 𝑣 𝑊 = 0.25.


Modularity. Suddividere una rete in partizioni (o cluster) contenenti un elevato
numero di archi al loro interno e pochi archi che le connettono l'una all'altra, viene
detto Community Detection. La modularity misura la qualità del partizionamento, ovvero
quanto bene la struttura di un grafo è stata suddivisa in moduli (chiamati anche
gruppi, cluster o community).
        Grafi con alta modularity hanno connessioni dense tra i nodi appartenenti allo
stesso modulo e sparse tra i nodi appartenenti a moduli differenti. La modularity è
rappresentata dalla differenza tra il numero di archi contenuti nei cluster di uno
specifico partizionamento del grafo e il numero atteso di archi contenuti nei cluster
di un grafo random, avente la stessa node degree distribution del grafo per cui viene
calcolata tale metrica [23],[24].
        In questo modo è possibile stabilire se effettivamente il numero di archi
interni ad una community sia maggiore di quanto ci si aspetterebbe da un grafo
casuale. Consideriamo un partizionamento 𝑉 = (𝑉1 , 𝑉2 , … , 𝑉 𝑘 ) di un grafo 𝐺(𝑉, 𝐸).
La modularity 𝑄 è un punteggio assegnato al clustering definito come:
                                            𝑘
                                 1                                        𝑑𝑢 𝑑𝑣
                              𝑄=                             𝐴 𝑢,𝑣 −
                                 2𝑚                                       2𝑚
                                          𝑖=1 𝑢,𝑣∈𝑉 𝑖

Dove 𝑚 = #𝑎𝑟𝑐𝑕𝑖, 𝐴 𝑢,𝑣 = 1 𝑠𝑒 𝑢, 𝑣 ∈ 𝐸 e 0 altrimenti, 𝑑 𝑢 𝑑 𝑣 sono il degree dei
                         𝑑𝑢 𝑑𝑣
rispettivi nodi 𝑢 e 𝑣,           è il numero atteso di archi tra in nodi 𝑢 𝑒 𝑣 nel grafo
                         2𝑚

random. Questa misura è un valore scalare compreso tra -1 e 1 e nel caso di reti
pesate è definita come [25]:
                                    1                       𝑘 𝑖 𝑘𝑗
                            𝑄=                  𝐴 𝑖𝑗 −             𝛿 𝐶 𝑖 , 𝐶𝑗
                                    2𝑚                      2𝑚
                                          𝑖,𝑗

Dove 𝐴 𝑖𝑗 rappresenta il peso dell'arco tra i nodi 𝑖 e 𝑗, 𝑘 𝑖 =                   𝑗   𝐴 𝑖𝑗 è la somma dei
pesi degli archi incidenti al vertice 𝑖, 𝐶 𝑖 è la community a cui il vertice 𝑖 viene
assegnato, la funzione 𝛿 𝐶 𝑖 , 𝐶𝑗        è uguale a 1 se 𝐶 𝑖 = 𝐶𝑗 (𝑢 𝑒 𝑣 appartengono alla
                                                        1
stessa community) e zero altrimenti ed 𝑚 = 2                   𝑖,𝑗   𝐴 𝑖𝑗 .




                                                                                                      49
Calcolare la modularity per grafi di grandi dimensioni, non è un processo
banale in termini di tempo di calcolo. In [63] è stato definito il Louvain Method, un
algoritmo approssimato che permette di calcolare la metrica su grafi di grandi
dimensioni in tempi relativamente rapidi. Ad esempio, impiega solo due minuti per
analizzare una rete di due milioni di nodi. In figura 3.3 viene schematizzato il metodo
Louvain, costituito da due fasi, ripetute iterativamente.




Fig.3.3: vengono mostrate in modo schematico le due fasi del Louvain Method. Si
ripetono così i due passi fino a che non si rilevano più cambiamenti a fronte di nuove
iterazioni e la massimizzazione della modularity è raggiunta.


        Nella prima fase ciascun nodo viene associato ad una propria comunità. Per
ognuno di essi si verifica se il valore di modularità migliora inserendolo nel gruppo di
ciascuno dei suoi vicini. In caso positivo il nodo viene inserito nel cluster del vicino,
altrimenti ognuno rimane nel proprio cluster di partenza. Questa operazione viene
ripetuta fino a che non è più possibile migliorare il valore della modularity. La
seconda fase, aggrega i nodi appartenenti alla stessa community e costruisce una
nuova rete, dove i nodi sono le community. Questi due passi vengono ripetuti
iterativamente fino a che il valore della modulatiry converge a un valore stazionario,
che risulta essere il massimo valore raggiungibile.


Density. La densità di un grafo 𝐺(𝑉, 𝐸), che assume valori compresi tra 0 e 1,
misura il rapporto tra il numero di archi che esistono nell'insieme 𝐸 e il massimo


                                                                                      50
numero possibile di archi che possono esistere tra tutti i nodi 𝑣 ∈ 𝑉. Pertanto la
densità viene calcolata nel caso di grafo non diretto (che non può avere cicli) come
segue:
                                              2 𝐸
                                           𝑉 ( 𝑉 − 1)
Mentre nel caso di grafo diretto, viene calcolata come segue:
                                                𝐸
                                           𝑉 ( 𝑉 − 1)
Se il numero di archi di un grafo si avvicina al numero massimo possibile, allora il
grafo viene considerato denso, viceversa, se il grafo contiene pochi archi, viene
considerato sparso. Un grafo completo ha tutti i possibili archi, dunque ha una
densità pari a 1.

3.3.2 Indicatori/metriche su grafo dinamico
Flooding time. Il processo di diffusione di un messaggio in un Contact Graph
𝐺(𝑉, 𝐸), è simulato supponendo che, ogni entità che può essere diffusa su una rete
di contatti, può essere modellata come un messaggio. Il processo è simulato in uno
scenario ideale, dove ciascun nodo ha un'infinita quantità di risorse e il ritardo di
trasmissione del messaggio non viene considerato.
         Sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli istanti temporali in cui il grafo
varia nel tempo, viene definito un semplice protocollo di flooding, dove ∀𝑡 𝑖 ∈ 𝑇, con
0 ≤ 𝑖 ≤ 𝑛, un nodo 𝑣 invia il messaggio a tutti i vicini e a loro volta i vicini di 𝑣
inviano il messaggio ai relativi vicini.
         Al fine di modellare il processo di diffusione di un messaggio, viene definito
un messaggio 𝑀 𝑣0,𝑡0 generato da un nodo 𝑣0 (chiamato seed) al tempo 𝑡0 . Il nodo
𝑣0 viene scelto uniformemente fra tutti i nodi 𝑣 ∈ 𝑁 𝑛𝑜𝑡       𝑖𝑠𝑜𝑙𝑎𝑡𝑒𝑑   , dove 𝑁 𝑛𝑜𝑡   𝑖𝑠𝑜𝑙𝑎𝑡𝑒𝑑   ,
è l'insieme di tutti i nodi della rete non isolati e 𝑡0 è il primo tempo in cui il nodo 𝑣0
appare nella rete dinamica.
         Viene utilizzando il protocollo di flooding, definito prima, per simulare un
processo di diffusione di un'informazione. Eseguendo il protocollo 20 volte,
calcolando una media dei risultati ottenuti per ogni simulazione, si può osservare
come in media cresce nel tempo il numero di nodi a cui il messaggio è arrivato. Nel
Capitolo 5 verrà usata tale osservazione per comparare i tempi diffusione di un


                                                                                               51
messaggio, tra le reti ottenute usando i modelli di mobilità e quelle ottenute a partire
dalle tracce di contatti reali.


Inter-contact time. Si tratta dell'intervallo di tempo che intercorre tra due successivi
contatti tra gli stessi nodi. Viene calcolato alla fine di ogni contatto e all'inizio del
successivo. Calcolando la Inter contact time distribution si può scoprire quale è la
probabilità che un contatto, tra due stessi nodi, si ripeta dopo un determinato
numero di secondi.

Intra-contact time (o contact duration). Misura l'intervallo di tempo durante il
quale due nodi possono comunicare; si tratta quindi del tempo che i nodi possono
utilizzare per scambiarsi dati e informazioni. Il numero di questi contatti e la loro
distribuzione sono fattori importanti per determinare la capacità di diffusione di un
messaggio, perché maggiore è il numero di contatti, maggiore è la probabilità che un
messaggio si diffonda in gran parte della rete. Calcolando la Intra contact time
distribution si può osservare quale è la probabilità di avere un contatto che duri un
determinato numero di secondi.

Temporal correlations.
        La Conditional probability Distribution of link's existence è un indicatore ideato per
comprendere se, conoscendo l'esistenza passata di un contatto (rappresentato da un
arco del Contact Graph), è possibile avere informazioni riguardo la sua eventuale
esistenza futura.
        Sia 𝐺(𝑉, 𝐸), un Contact Graph e sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli
istanti temporali in cui 𝐺 varia nel tempo. La probabilità di esistenza di un arco
𝑒 ∈ 𝐸, al tempo 𝑡 𝑖 ∈ 𝑇, con 0 ≤ 𝑖 ≤ 𝑛, è definita come:

                                                          𝑃 𝑒
                                  𝑃𝑒 = 𝑃 𝑋 𝑒 𝑡 𝑖 = 1 =
                                                            𝑇

dove 𝑃 𝑒 (cardinalità del presence schedule di 𝑒) è il numero di istanti in cui l'arco 𝑒
appare in 𝐺, e 𝑇 è il numero totale d'istanti temporali in cui 𝑒 può apparire.
Definite ora le seguenti probabilità condizionate:

                           𝑃 𝑒,1 = 𝑃 𝑋 𝑒 𝑡 𝑖 = 1|𝑋 𝑒 𝑡 𝑖 − 1 = 1

                                                                                           52
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models
Validation and analysis of mobility models

Contenu connexe

Tendances

Risorse infrastrutturali area vasta di Torremaggiore
Risorse infrastrutturali area vasta di TorremaggioreRisorse infrastrutturali area vasta di Torremaggiore
Risorse infrastrutturali area vasta di Torremaggioregifanta
 
Dispensa Interazione Uomo Macchina
Dispensa Interazione Uomo MacchinaDispensa Interazione Uomo Macchina
Dispensa Interazione Uomo MacchinaStefano Bussolon
 
Progettare artefatti cognitivi
Progettare artefatti cognitiviProgettare artefatti cognitivi
Progettare artefatti cognitiviStefano Bussolon
 
Dispensa di analisi dei dati
Dispensa di analisi dei datiDispensa di analisi dei dati
Dispensa di analisi dei datiStefano Bussolon
 
Joseki : un server per interrogare risorse RDF attraverso un interfaccia Web
Joseki : un server per interrogare risorse RDF attraverso un interfaccia WebJoseki : un server per interrogare risorse RDF attraverso un interfaccia Web
Joseki : un server per interrogare risorse RDF attraverso un interfaccia WebCyclope86
 
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...paoloUser
 
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...Myrteza Kertusha
 
I promessi sposi 3.0 Mobile User Experience & Usability nel settore dei beni...
I promessi sposi 3.0  Mobile User Experience & Usability nel settore dei beni...I promessi sposi 3.0  Mobile User Experience & Usability nel settore dei beni...
I promessi sposi 3.0 Mobile User Experience & Usability nel settore dei beni...RiccardoPietra
 
Progettazione ed implementazione di una base di dati per la gestione di emiss...
Progettazione ed implementazione di una base di dati per la gestione di emiss...Progettazione ed implementazione di una base di dati per la gestione di emiss...
Progettazione ed implementazione di una base di dati per la gestione di emiss...Francesco Occhioni
 
Il mio libro - My book (intro)
Il mio libro - My book (intro)Il mio libro - My book (intro)
Il mio libro - My book (intro)pls3d
 
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - Tesi
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - TesiIl Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - Tesi
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - TesiFrancesco Magagnino
 
Analisi Usabilità 3d Mansion
Analisi Usabilità 3d MansionAnalisi Usabilità 3d Mansion
Analisi Usabilità 3d MansionRoberta Sanzani
 
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...Nicola Cerami
 
Ponte lambro dossier aprile 2011 def
Ponte lambro dossier aprile 2011 defPonte lambro dossier aprile 2011 def
Ponte lambro dossier aprile 2011 defMarco Garoffolo
 
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013 Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013 AmmLibera AL
 
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...AmmLibera AL
 
Dispense Probabilità (1.3)
Dispense Probabilità (1.3)Dispense Probabilità (1.3)
Dispense Probabilità (1.3)Luigi Carassale
 

Tendances (20)

Risorse infrastrutturali area vasta di Torremaggiore
Risorse infrastrutturali area vasta di TorremaggioreRisorse infrastrutturali area vasta di Torremaggiore
Risorse infrastrutturali area vasta di Torremaggiore
 
A.Dionisi Thesis
A.Dionisi ThesisA.Dionisi Thesis
A.Dionisi Thesis
 
Dispensa Interazione Uomo Macchina
Dispensa Interazione Uomo MacchinaDispensa Interazione Uomo Macchina
Dispensa Interazione Uomo Macchina
 
Progettare artefatti cognitivi
Progettare artefatti cognitiviProgettare artefatti cognitivi
Progettare artefatti cognitivi
 
Dispensa di analisi dei dati
Dispensa di analisi dei datiDispensa di analisi dei dati
Dispensa di analisi dei dati
 
Joseki : un server per interrogare risorse RDF attraverso un interfaccia Web
Joseki : un server per interrogare risorse RDF attraverso un interfaccia WebJoseki : un server per interrogare risorse RDF attraverso un interfaccia Web
Joseki : un server per interrogare risorse RDF attraverso un interfaccia Web
 
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...
Valutazione di descrittori per il rilevamento automatico di nuclei cellulari ...
 
Resport linee guida ita 20 gennaio 2020
Resport linee guida ita 20 gennaio 2020Resport linee guida ita 20 gennaio 2020
Resport linee guida ita 20 gennaio 2020
 
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...
Progetto e realizzazione di un kernel linux per il controllo dinamico degli s...
 
Aqfa probabilita
Aqfa   probabilitaAqfa   probabilita
Aqfa probabilita
 
I promessi sposi 3.0 Mobile User Experience & Usability nel settore dei beni...
I promessi sposi 3.0  Mobile User Experience & Usability nel settore dei beni...I promessi sposi 3.0  Mobile User Experience & Usability nel settore dei beni...
I promessi sposi 3.0 Mobile User Experience & Usability nel settore dei beni...
 
Progettazione ed implementazione di una base di dati per la gestione di emiss...
Progettazione ed implementazione di una base di dati per la gestione di emiss...Progettazione ed implementazione di una base di dati per la gestione di emiss...
Progettazione ed implementazione di una base di dati per la gestione di emiss...
 
Il mio libro - My book (intro)
Il mio libro - My book (intro)Il mio libro - My book (intro)
Il mio libro - My book (intro)
 
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - Tesi
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - TesiIl Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - Tesi
Il Modello Pragmatico Elementare per lo sviluppo di Sistemi Adattivi - Tesi
 
Analisi Usabilità 3d Mansion
Analisi Usabilità 3d MansionAnalisi Usabilità 3d Mansion
Analisi Usabilità 3d Mansion
 
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...
Progetto per lo sviluppo di un sistema di gestione della conoscenza per il pr...
 
Ponte lambro dossier aprile 2011 def
Ponte lambro dossier aprile 2011 defPonte lambro dossier aprile 2011 def
Ponte lambro dossier aprile 2011 def
 
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013 Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013
Linee guida per il disaster recovery delle PA - AgID Aggiornamento 2013
 
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...
Linee guida nazionali per la valorizzazione del patrimonio informativo pubbli...
 
Dispense Probabilità (1.3)
Dispense Probabilità (1.3)Dispense Probabilità (1.3)
Dispense Probabilità (1.3)
 

En vedette

Sakilla Datawarehouse and Datamining
Sakilla Datawarehouse and DataminingSakilla Datawarehouse and Datamining
Sakilla Datawarehouse and DataminingUmberto Griffo
 
China tour itinerary new
China tour itinerary newChina tour itinerary new
China tour itinerary newAbdul Mukati
 
クリエイティブ・コークッキングの思想と実践【卒論発表】
クリエイティブ・コークッキングの思想と実践【卒論発表】クリエイティブ・コークッキングの思想と実践【卒論発表】
クリエイティブ・コークッキングの思想と実践【卒論発表】Taichi Isaku
 
SONNET 69 DECARIS LOGAN
SONNET 69 DECARIS LOGANSONNET 69 DECARIS LOGAN
SONNET 69 DECARIS LOGANdmulah
 
CoCooking Space 〜新しい食文化のプラットフォーム〜
CoCooking Space 〜新しい食文化のプラットフォーム〜CoCooking Space 〜新しい食文化のプラットフォーム〜
CoCooking Space 〜新しい食文化のプラットフォーム〜Taichi Isaku
 
MACUL 2016 - Explore - MAKER ED
MACUL 2016 - Explore - MAKER EDMACUL 2016 - Explore - MAKER ED
MACUL 2016 - Explore - MAKER EDJonathonGood
 
Kilroy travels
Kilroy travelsKilroy travels
Kilroy travelssossoti
 
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)cinasintes
 
Best friends forever
Best friends foreverBest friends forever
Best friends foreverkaren_Escobar
 
Management Drives Onderwijs brochure
Management Drives Onderwijs brochureManagement Drives Onderwijs brochure
Management Drives Onderwijs brochuremdonderwijs
 
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォーム
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォームクッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォーム
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォームTaichi Isaku
 
Vameg brochure Ver. May 2013
Vameg brochure Ver. May 2013Vameg brochure Ver. May 2013
Vameg brochure Ver. May 2013Kostas Voliotis
 
VAMEG HELLAS Projects portfolio GB VER 2016 A web
VAMEG HELLAS Projects portfolio  GB VER 2016 A webVAMEG HELLAS Projects portfolio  GB VER 2016 A web
VAMEG HELLAS Projects portfolio GB VER 2016 A webKostas Voliotis
 
Seg e med-comportamento_seguro
Seg e med-comportamento_seguroSeg e med-comportamento_seguro
Seg e med-comportamento_seguroSilvana Fontes
 
Towards a System of Pattern-Enhanced Cooking in the Inclusively Creative City
Towards a System of Pattern-Enhanced  Cooking in the Inclusively Creative CityTowards a System of Pattern-Enhanced  Cooking in the Inclusively Creative City
Towards a System of Pattern-Enhanced Cooking in the Inclusively Creative CityTaichi Isaku
 

En vedette (20)

Sakilla Datawarehouse and Datamining
Sakilla Datawarehouse and DataminingSakilla Datawarehouse and Datamining
Sakilla Datawarehouse and Datamining
 
China tour itinerary new
China tour itinerary newChina tour itinerary new
China tour itinerary new
 
クリエイティブ・コークッキングの思想と実践【卒論発表】
クリエイティブ・コークッキングの思想と実践【卒論発表】クリエイティブ・コークッキングの思想と実践【卒論発表】
クリエイティブ・コークッキングの思想と実践【卒論発表】
 
SONNET 69 DECARIS LOGAN
SONNET 69 DECARIS LOGANSONNET 69 DECARIS LOGAN
SONNET 69 DECARIS LOGAN
 
CoCooking Vision
CoCooking VisionCoCooking Vision
CoCooking Vision
 
CoCooking Space 〜新しい食文化のプラットフォーム〜
CoCooking Space 〜新しい食文化のプラットフォーム〜CoCooking Space 〜新しい食文化のプラットフォーム〜
CoCooking Space 〜新しい食文化のプラットフォーム〜
 
MACUL 2016 - Explore - MAKER ED
MACUL 2016 - Explore - MAKER EDMACUL 2016 - Explore - MAKER ED
MACUL 2016 - Explore - MAKER ED
 
Kilroy travels
Kilroy travelsKilroy travels
Kilroy travels
 
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)
Treball filosofiaaaaaaaaaaaaaaaaaaaaaaaaaaaaa(1) (1) (1)
 
Best friends forever
Best friends foreverBest friends forever
Best friends forever
 
1 -cemig_nas_escolas
1  -cemig_nas_escolas1  -cemig_nas_escolas
1 -cemig_nas_escolas
 
El patito feo
El patito feoEl patito feo
El patito feo
 
Management Drives Onderwijs brochure
Management Drives Onderwijs brochureManagement Drives Onderwijs brochure
Management Drives Onderwijs brochure
 
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォーム
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォームクッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォーム
クッキング・ランゲージ - 和食文化を発信する「ことば」のプラットフォーム
 
Vameg brochure Ver. May 2013
Vameg brochure Ver. May 2013Vameg brochure Ver. May 2013
Vameg brochure Ver. May 2013
 
VAMEG HELLAS Projects portfolio GB VER 2016 A web
VAMEG HELLAS Projects portfolio  GB VER 2016 A webVAMEG HELLAS Projects portfolio  GB VER 2016 A web
VAMEG HELLAS Projects portfolio GB VER 2016 A web
 
Seg e med-comportamento_seguro
Seg e med-comportamento_seguroSeg e med-comportamento_seguro
Seg e med-comportamento_seguro
 
Zvit123
Zvit123Zvit123
Zvit123
 
Towards a System of Pattern-Enhanced Cooking in the Inclusively Creative City
Towards a System of Pattern-Enhanced  Cooking in the Inclusively Creative CityTowards a System of Pattern-Enhanced  Cooking in the Inclusively Creative City
Towards a System of Pattern-Enhanced Cooking in the Inclusively Creative City
 
Q1
Q1Q1
Q1
 

Similaire à Validation and analysis of mobility models

Piano Nazionale Scuola Digitale (risorse integrative)
Piano Nazionale Scuola Digitale (risorse integrative)Piano Nazionale Scuola Digitale (risorse integrative)
Piano Nazionale Scuola Digitale (risorse integrative)Ministry of Public Education
 
Il tutorial di Python
Il tutorial di PythonIl tutorial di Python
Il tutorial di PythonAmmLibera AL
 
Imparare c n.104
Imparare c  n.104Imparare c  n.104
Imparare c n.104Pi Libri
 
Orchestrazione delle risorse umane nel BPM
Orchestrazione delle risorse umane nel BPMOrchestrazione delle risorse umane nel BPM
Orchestrazione delle risorse umane nel BPMMichele Filannino
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...michael_mozzon
 
Innovazione, comunità professionali e pubblica amministrazione il caso csi
Innovazione, comunità professionali e pubblica amministrazione  il caso csiInnovazione, comunità professionali e pubblica amministrazione  il caso csi
Innovazione, comunità professionali e pubblica amministrazione il caso csiCarlo Mazzocco
 
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...Porting evolutivo di un’applicazione per la gestione di note spese in ambient...
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...enriconatella
 
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...fcecutti
 
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...Daniele Ciriello
 
Openfisca Managing Tool: a tool to manage fiscal sistems
Openfisca Managing Tool: a tool to manage fiscal sistemsOpenfisca Managing Tool: a tool to manage fiscal sistems
Openfisca Managing Tool: a tool to manage fiscal sistemsLorenzo Stacchio
 
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...Andrea Bidinost
 
Inoltro di pacchetti ip in sistemi linux
Inoltro di pacchetti ip in sistemi linuxInoltro di pacchetti ip in sistemi linux
Inoltro di pacchetti ip in sistemi linuxCe.Se.N.A. Security
 
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...Domenico Schillaci
 
Master plan le città del golfo e le isole pontine
Master plan le città del golfo e le isole pontineMaster plan le città del golfo e le isole pontine
Master plan le città del golfo e le isole pontineLuigi Tecno
 
Implementazione hardware/software di un sistemamultitouch per l'interazione u...
Implementazione hardware/software di un sistemamultitouch per l'interazione u...Implementazione hardware/software di un sistemamultitouch per l'interazione u...
Implementazione hardware/software di un sistemamultitouch per l'interazione u...Pier Giuliano Nioi
 

Similaire à Validation and analysis of mobility models (20)

a4_centrata
a4_centrataa4_centrata
a4_centrata
 
Piano Nazionale Scuola Digitale (risorse integrative)
Piano Nazionale Scuola Digitale (risorse integrative)Piano Nazionale Scuola Digitale (risorse integrative)
Piano Nazionale Scuola Digitale (risorse integrative)
 
Il tutorial di Python
Il tutorial di PythonIl tutorial di Python
Il tutorial di Python
 
Imparare c n.104
Imparare c  n.104Imparare c  n.104
Imparare c n.104
 
Orchestrazione delle risorse umane nel BPM
Orchestrazione delle risorse umane nel BPMOrchestrazione delle risorse umane nel BPM
Orchestrazione delle risorse umane nel BPM
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
 
Innovazione, comunità professionali e pubblica amministrazione il caso csi
Innovazione, comunità professionali e pubblica amministrazione  il caso csiInnovazione, comunità professionali e pubblica amministrazione  il caso csi
Innovazione, comunità professionali e pubblica amministrazione il caso csi
 
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...Porting evolutivo di un’applicazione per la gestione di note spese in ambient...
Porting evolutivo di un’applicazione per la gestione di note spese in ambient...
 
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...
Tecniche di Test-driven development in ambito sicurezza informatica e rilevaz...
 
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...
Reti neurali di convoluzione per la visione artificiale - Tesi di Laurea Magi...
 
Tesi
TesiTesi
Tesi
 
Monitoraggio di rete con nagios
Monitoraggio di rete con nagiosMonitoraggio di rete con nagios
Monitoraggio di rete con nagios
 
Openfisca Managing Tool: a tool to manage fiscal sistems
Openfisca Managing Tool: a tool to manage fiscal sistemsOpenfisca Managing Tool: a tool to manage fiscal sistems
Openfisca Managing Tool: a tool to manage fiscal sistems
 
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...
Sviluppo e studio di un algoritmo genetico per la ricerca di un intervallo di...
 
Inoltro di pacchetti ip in sistemi linux
Inoltro di pacchetti ip in sistemi linuxInoltro di pacchetti ip in sistemi linux
Inoltro di pacchetti ip in sistemi linux
 
Comunicazione in un progetto di educativa di strada con strumenti Web 2.0
Comunicazione in un progetto di educativa di strada con strumenti Web 2.0Comunicazione in un progetto di educativa di strada con strumenti Web 2.0
Comunicazione in un progetto di educativa di strada con strumenti Web 2.0
 
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...
Sviluppo di un sistema per il monitoraggio ambientale basato su reti di senso...
 
Master plan le città del golfo e le isole pontine
Master plan le città del golfo e le isole pontineMaster plan le città del golfo e le isole pontine
Master plan le città del golfo e le isole pontine
 
Implementazione hardware/software di un sistemamultitouch per l'interazione u...
Implementazione hardware/software di un sistemamultitouch per l'interazione u...Implementazione hardware/software di un sistemamultitouch per l'interazione u...
Implementazione hardware/software di un sistemamultitouch per l'interazione u...
 
Tesi
TesiTesi
Tesi
 

Validation and analysis of mobility models

  • 1. Facoltà di Ingegneria Corso di laurea in Ingegneria Informatica Tesi di laurea Magistrale in Ingegneria Informatica Validation and analysis of mobility models Relatore Candidato Prof. Luca Becchetti Umberto Griffo Correlatore Prof. Leonardo Querzoni A/A 2011/2012
  • 2. Indice Introduzione ..................................................................................................... 4 User Mobility.................................................................................................... 8 1.1 Tecnologie................................................................................................................. 9 1.2 Tracce di mobilità .................................................................................................. 12 1.2.1 CRAWDAD ................................................................................................... 13 1.2.2 SocioPattern ................................................................................................... 14 1.2.3 SocialDIS ........................................................................................................ 17 1.2.4 MACRO.......................................................................................................... 20 Mobility Models ............................................................................................. 27 2.1 Individual mobility models .................................................................................. 29 2.1.1 Random Walk (RW)...................................................................................... 29 2.1.2 Random Waypoint (RWP) ........................................................................... 30 2.1.3 Random Direction (RD) .............................................................................. 32 2.1.4 Truncated Lèvi Walk (TLW) ....................................................................... 33 2.1.5 Boundless Simulation Area (BD) ............................................................... 34 2.1.6 Gauss-Markov (GM) .................................................................................... 36 2.1.7 Probabilistic Random Walk (PRW)............................................................ 38 2.1.8 Weighted Waypoint (WW) .......................................................................... 40 2.2 Group mobility models ........................................................................................ 41 2.2.1 Exponential Correlated Random ................................................................ 41 2.2.2 Column ........................................................................................................... 41 2.2.3 Nomadic Community ................................................................................... 42 2.2.4 Pursue .............................................................................................................. 42 2.2.5 Reference Point Group (RPG) ................................................................... 43 Grafi dinamici................................................................................................. 44 3.1 Definizione del grafo dinamico dei contatti ...................................................... 44 3.2 Definizione del grafo aggregato dei contatti ..................................................... 47 3.3 Indicatori statistici/metriche................................................................................ 47 3.3.1 Indicatori/metriche su grafo aggregato ..................................................... 47 3.3.2 Indicatori/metriche su grafo dinamico ..................................................... 51 2
  • 3. 3.4 Rappresentazioni di grafi dinamici...................................................................... 55 3.4.1 Graph Exchange XML Format (GEXF) .................................................. 56 3.4.2 Dynamic Network Format (DNF) ............................................................. 57 Sistema per l'analisi di grafi dinamici............................................................. 64 4.1 Gephi Platform ...................................................................................................... 64 4.1.1 Gephi Dynamic API ..................................................................................... 67 4.2 DNF Dynamic ....................................................................................................... 68 4.3 DNF Importer ....................................................................................................... 71 4.4 Mobility Model Generator ................................................................................... 72 4.4.1 Mobility Simulator......................................................................................... 72 4.4.2 Random Waypoint Mobility Model Generator ........................................ 73 4.4.3 Truncated Lèvi Walk Mobility Model Generator .................................... 74 4.5 Indicatori statistici/Metriche ............................................................................... 76 4.5.1 Weighted Clustering Coefficient e Strength ............................................. 76 4.5.2 Flooding time ................................................................................................. 77 4.5.3 Inter-contact time ed Intra-contact time ................................................... 79 4.5.4 Conditional probability Distribution of link's existence ......................... 80 4.5.5 Link's existence variability ........................................................................... 80 4.5.6 Pearson correlation matrix........................................................................... 81 4.6 Ulteriori script e riferimenti ................................................................................. 83 Validazione sperimentale dei modelli di mobilità .......................................... 84 5.1 Comparazione con i dati dell'esperimento SocialDIS ..................................... 86 5.1.1 Modelli nella loro formulazione originaria ................................................ 86 5.1.2 Modelli con aree di simulazione scalate di un fattore 10 ...................... 103 5.2 Comparazione con i dati dell'esperimento MACRO ..................................... 116 5.2.1 Modelli nella loro formulazione originaria .............................................. 116 5.2.2 Modelli con aree di simulazione scalate di un fattore 10 ...................... 130 5.3 Sintesi dei risultati ottenuti ................................................................................. 141 Conclusioni .................................................................................................. 143 6.1 Proposte di sviluppo future ............................................................................... 144 Bibliografia ................................................................................................... 147 3
  • 4. Introduzione I modelli di mobilità riproducono i movimenti di utenti mobili assegnando a ciascuno di essi una posizione, una velocità ed un'accelerazione che cambiano nel tempo. Nel lavoro svolto in questa tesi è stata condotta un'estesa analisi statistica volta a indagare l'efficacia di due importanti modelli di mobilità nel riprodurre il comportamento di tracce reali. A tale scopo è stato fatto uso di tracce di mobilità raccolte in due esperimenti sociali svolti in due differenti contesti: l'esperimento SocialDIS, svoltosi a partire dal 17/10/2011 al primo piano del Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza Università di Roma, e l'esperimento NeonMACRO, effettuato il 20 Giugno 2012, in occasione della mostra d'arte NEON, presso il museo d'arte contemporanea di Roma MACRO. Tramite una piattaforma RFID-based sono stati tracciati i contatti di prossimità tra persone in entrambi gli esperimenti. A partire da questi dati, sono stati costruiti dei grafi dinamici che descrivono l'evoluzione temporale delle interazioni sociali tra individui, usando un formalismo che consente di memorizzarli più efficientemente di quanto fosse possibile in passato. Tale formalismo, ideato e sviluppato in questo lavoro, permette una rappresentazione notevolmente compatta ed efficiente in termini di occupazione di memoria e manipolabilità. Per analizzare l'efficacia dei modelli nel riprodurre tracce compatibili con il reale comportamento di agenti mobili, si sono analizzati e confrontati i grafi dinamici, ottenuti a partire dagli esperimenti sociali sopra citati, con quelli generati a partire dai modelli di mobilità Random Waypoint e Truncated Lévy Walk. A tal fine sono stati sviluppati diversi moduli software basati sul framework Gephi [11] (http://gephi.org), in particolare per:  simulare la dinamicità temporale del grafo dei contatti con elevate prestazioni, in termini di tempo di calcolo e quantità di memoria allocata;  importare nella piattaforma Gephi grafi che adottano il nuovo formalismo di memorizzazione; 4
  • 5. generare grafi dinamici a partire dal Random Waypoint Mobility Model e dal Truncated Lévy Walk Mobility Model;  misurare le proprietà statiche (Graph Density, Cluster Coefficient, Weighted Clustering Coefficient, Strength, Modularity) e dinamiche (Inter-Intra Contact Time, Conditional probability of link's existence, Link's existence variability, Matrix correlation) dei grafi dinamici da confrontare. I grafi dinamici costruiti sono stati analizzati sia in forma aggregata che in forma dinamica, rispettivamente aggregando le interazioni a distanza ravvicinata per intervalli di tempo che vanno dalle 2 ore (nel caso NeonMACRO) alle 12 ore (nel caso SocialDIS), e valutando l'evoluzione dei contatti secondo per secondo. Le prime analisi condotte mostrano che nel caso SocialDIS tipicamente gli individui hanno contatti di prossimità prevalentemente con altri individui con cui hanno stretto un legame d'amicizia e raramente con altri individui sconosciuti, mentre nel caso NeonMACRO le persone tendono a comunicare soprattutto con quelle che appartengono alla stessa comitiva e sporadicamente con tutte le altre. Questo comportamento tipico degli individui, riscontrato negli esperimenti, non viene catturato dai modelli di mobilità RWP e TLW i quali sono stati opportunamente configurati per riprodurre in modo realistico il movimento delle persone nei due differenti contesti. In particolare, una differenza fondamentale emerge confrontando i risultati forniti dalle metriche statiche applicabili sui grafi aggregati e dalle metriche dinamiche applicabili su quelli non aggregati. Gli agenti che si muovono secondo questi due modelli di mobilità tendono a comunicare con quasi tutti gli altri agenti e tendono a produrre intervalli tra contatti successivi che mediamente risultano eccessivamente lunghi. Successivamente si sono investigate importanti differenze temporali indotte dai modelli e presenti anche nelle tracce reali. I modelli RWP e TLW mostrano inoltre significative correlazioni spaziali tra contatti distinti, sia simulando quanto avviene in SocialDIS che nel NeonMacro. Analizzando gli schemi delle comunicazioni in SocialDIS si è riscontrato che la correlazione spaziale tra contatti distinti risulta essere esigua, mentre risulta essere leggermente maggiore in NeonMACRO. Infine, attraverso l'implementazione di un semplice protocollo di flooding si sono investigate le proprietà diffusive dei grafi prodotti dalle tracce reali e le si sono 5
  • 6. confrontate con quelle dei modelli. E' stato appurato che entrambi i modelli, proprio per il fatto di generare un elevato numero di comunicazioni che coinvolgono quasi tutti gli individui, falliscono nel rappresentare il comportamento diffusivo mostrato dagli esperimenti SocialDIS e NeonMACRO. La totalità dei risultati statistici di questo studio hanno permesso di chiarire quali sono i limiti dei modelli di mobilità adottati nella sperimentazione, almeno nel tipo di scenari considerati, in modo da comprendere quali possano essere le modifiche da apportare per ottenere dei modelli più realistici. La tesi è strutturata come segue:  Capitolo 1: vengono illustrate quali tecnologie consentono la raccolta di tracce di mobilità nei casi reali, le più recenti tracce di mobilità collezionate e rese disponibili dal mondo accademico e quelle invece ottenute dagli esperimenti che sono stati condotti nell'ambito del lavoro di tesi.   Capitolo 2: viene data la definizione dei dataset sintetici e i modelli di mobilità, fornendo di questi ultimi una classificazione e successivamente illustrando quelli più usati per riprodurre il comportamento di dispositivi mobili in reti ad hoc.   Capitolo 3: viene data la definizione dei grafi dinamici dei contatti e come possono essere costruiti a partire dai dati collezionati nei casi reali e da quelli ottenuti nei casi simulati con i modelli di mobilità adottati. In seguito vengono definiti gli indicatori statistici/metriche che sono stati implementati per poter condurre l'analisi statistica (trattata nel Capitolo 5), le limitazioni del formato attualmente più utilizzato per la scrittura di grafi dinamici su file e il nuovo formato che è stato ideato per superarle.   Capitolo 4: vengono presentati i moduli software sviluppati sulla piattaforma Gephi con lo scopo di simulare la dinamicità temporale del grafo dei contatti, importare grafi dinamici memorizzati secondo un nuovo formalismo, generare grafi dinamici a partire dai modelli di mobilità e calcolare gli indicatori statistici/metriche. 6
  • 7.   Capitolo 5: vengono illustrati e motivati i risultati dell'analisi e validazione sperimentale condotta confrontando i comportamenti degli individui tracciati negli esperimenti SocialDIS e NeonMACRO, con i comportamenti degli individui i cui movimenti sono stati dettati dai modelli di mobilità Random Waypoint e Truncated Lévy Walk.   Capitolo 6: vengono presentate le considerazioni finali e i possibili sviluppi futuri. 7
  • 8. Capitolo 1 User Mobility La crescente diffusione e popolarità di dispositivi equipaggiati con interfacce di rete wireless, come ad esempio gli smartphone di ultima generazione, rende possibile collezionare nuove sorgenti dati, che descrivono il movimento e comportamento di individui nei più disparati ambienti e contesti. L'accesso a tali collezioni di dati, permette di investigare sulle interazioni delle reti sociali e sull'evoluzione di processi dinamici, come la diffusione di un'informazione, la formazione di un'opinione, o un processo epidemico. Esistono due tipi di data set usati per valutare processi e protocolli applicabili alle reti mobili: dataset empirici (o Empirical dataset), collezionati catturando i dati dai comportamenti reali dei dispositivi mobili, ovvero memorizzando le reali tracce di mobilità dei dispositivi mobili, o dataset sintetici (o Synthetic dataset), creati usando i modelli di mobilità, che provano a riprodurre il comportamento dei dispositivi mobili senza usare tracce di mobilità reali. I dati provenienti dal mondo reale consentono di capire gli schemi di comportamento che gli esseri umani adottano nelle loro attività. Quando si vogliono collezionare tali dati, le caratteristiche che interessa conoscere sono: posizione, direzione, velocità e tempo di pausa. Esistono diverse tecnologie che permettono di ottenere dati accurati sulle posizioni dei dispositivi, come i sensori GPS-based o Radio-based, ed esistono gli accelerometri per catturare i valori di velocità, direzione e tempo di pausa. Queste tecnologie possono essere classificate in base a quanto accuratamente riescono ad individuare la posizione di un dispositivo. Ad esempio utilizzando le reti cellulari GSM/UMTS, la posizione dell'utente può essere determinata tramite varie tecniche che permettono la sua localizzazione con un errore di massimo 50-150m, mentre con le tecnologie GPS, si arriva ad un errore massimo di 10-100m. 8
  • 9. Esiste un approccio alternativo per collezionare dati sui movimenti degli individui, basato solo sulla raccolta dei contatti che avvengono tra di loro. Vengono dunque raccolte le tracce dei contatti al posto delle tracce di mobilità, omettendo tutti i dati relativi a posizione, direzione, velocità e tempi di pausa, in modo da simulare solo le comunicazioni tra dispositivi. Per quanto concerne il lavoro svolto in questa tesi, è trovato interessante questo secondo approccio, ovvero collezionare dati generati da reti dinamiche di contatti (o dynamic contact network), ossia grafi che rappresentano le interazioni face-to-face o di prossimità tra individui. Catturando trace di mobilità, basate sui contatti reali, si possono osservare i veri comportamenti di tali individui. Nei prossimi sottoparagrafi saranno illustrate, quali tecnologie consentono la raccolta di tracce di mobilità nei casi reali, le più recenti tracce di mobilità raccolte e rese disponibili dal mondo accademico e quelle invece ottenute dagli esperimenti che sono stati condotti nell'ambito del lavoro di tesi. 1.1 Tecnologie Collezionare dataset realistici e di grandi dimensioni su attività e interazioni umane è un processo difficile e costoso. Al fine di costruire dataset empirici, ossia tracciare i comportamenti umani, sono stati usati dispositivi mobili cellulari o smartphone, laptop con schede di rete wireless e sensori wireless (ad esempio iMote), utilizzando reti di comunicazione di tipo Bluetooth e WiFi [30],[31],[32]. L'uso delle reti WiFi risulta essere, come dimostrato negli esperimenti condotti dall'Università di Dartmouth [33] e da quella di San Diego [41] , inaccurato nel costruire tracce di mobilità realistiche tra dispositivi mobili. Utilizzando la tecnologia WiFi i dati sulle interazioni device-to-device vengono raccolti assumendo che i dispositivi mobili, che entrano nel raggio di comunicazione dello stesso AP (access point), possono comunicare direttamente tra di loro, ossia i contatti vengono registrati al tempo in cui i due dispositivi condividono lo stesso AP. Sfortunatamente, questa assunzione non è realistica, perché due dispositivi collegati allo stesso access point non è detto che siano uno nel raggio di copertura dell'altro, e viceversa, possono essere nei rispettivi raggi di copertura e non condividere lo stesso AP. In quest'ultimo caso l'interazione non viene registrata rendendo i dati raccolti poco realistici. 9
  • 10. Inoltre un'altra problematica relativa alla tecnologia Wifi consiste nel fatto che i dispositivi non sono sempre situati nello stesso punto dove si trova il proprietario, pertanto i dati ottenuti non esprimono sempre i comportamenti di mobilità degli individui. La tecnologia Bluetooth, utilizzata nell'esperimento [34] condotto presso l'università di Toronto, dove le tracce di mobilità sono state collezionate da 20 cellulari distribuiti a gruppi di studenti, permette di collezionare contatti senza che i dispositivi debbano essere nel raggio di comunicazione dell'AP, ma allo stesso tempo richiede che il cellulare sia trasportato dai soggetti e che esso abbia una batteria con un'autonomia sufficiente per la durata dell'intero esperimento. Se i cellulari vengono ricaricati, si possono condurre lunghi esperimenti, ma ovviamente per essere ricaricato, il cellulare deve essere fermo e probabilmente distante dal proprietario, ottenendo la stessa problematica illustrata per il caso WiFi. Tracce di mobilità sono state collezionate anche con l'uso di sensori Intel iMote, utilizzando sempre la tecnologia Bluetooth. Essi registrano un contatto quando un dispositivo Bluetooth qualsiasi (sia un altro iMote che un PDA) entra nel suo raggio di copertura. Tramite questa tecnologia sono state raccolte tracce di mobilità in contesti differenti [30], ad esempio durante la conferenza IEEE INFOCOM 2005 di Miami [48], dove 41 iMote sono stati trasportati dai partecipanti per 3 giorni, o presso un laboratorio di ricerca della Università di Cambrige, dove sono stati registrati i comportamenti e le tracce di mobilità di 12 studenti di dottorato. Utilizzando le tecnologie Bluetooth e Wifi si possono raccogliere dati che rivelano proprietà strutturali e temporali di schemi di comportamento sociali, ma oltre che per i problemi già illustrati, queste tecnologie non sono adatte a rilevare contatti di prossimità (o face-to face) tra dispositivi, dal momento che possiedono una risoluzione spaziale massima di 10 metri e temporale di 2-5 minuti che non ci permette di stabilire se due individui comunicano uno di fronte all'altro a distanza ravvicinata (ad esempio 1 metro). Tali limitazioni possono essere superate attraverso l'uso dei dispositivi RFID (Radio Frequency Identification) [35],[65] RFID, una tecnologia per l'identificazione automatica di oggetti, animali o persone, basata sulla capacità di memorizzazione di dati da parte di particolari dispositivi elettronici (detti tag o transponder) e sulla capacità di questi di rispondere "all'interrogazione" a distanza, da parte di appositi 10
  • 11. apparati fissi o portatili chiamati reader a radiofrequenza, comunicando (o aggiornando) le informazioni in essi contenute. I tag RFID sono dei dispositivi dalle piccole dimensioni, facilmente indossabili da individui, che permettono di stabilire con accuratezza se questi sono in prossimità l'uno dell'altro. Questo perché i dispositivi possono scambiarsi pacchetti radio a bassa frequenza solo quando due persone si trovano ad una distanza che va da 1 a 1.5 m e sono una di fronte all'altra, in quanto il corpo umano costituisce una barriera a radio frequenze per la frequenza portante usata per la comunicazione. In tale contesto, la tecnologia RFID è stata adottata ed utilizzata dalla piattaforma SocioPatterns (http://www.sociopatterns.org) [36], un framework sperimentale RFID-based che permette di raccogliere dati sulle interazioni face-to-face tra individui che interagiscono a distanza ravvicinata. Durante gli esperimenti SocioPatterns [37],[38],[39],[40] i partecipanti indossano dei piccoli tag RFID. Quando gli individui indossano i tag continuamente vengono inviati pacchetti dati in broadcast. Quando una relazione di prossimità (o contatto) viene rilevata, il dispositivo invia un messaggio ad alta potenza. Questo pacchetto dati contiene un time stamp, l'id della stazione (RFID reader) che lo ha ricevuto e l'id dei tag che hanno partecipato nell'interazione. Il messaggio ricevuto dagli RFID reader, posizionati in modo fisso nell'ambiente, viene memorizzano localmente dal reader ed inoltrato ad un server centrale tramite rete LAN (Local Area Network), in modo da processare le informazioni in modalità online o offline. I tag RFID e I reader RFID usati negli esperimenti SocioPatterns, e negli esperimenti condotti nella tesi, sono stati creati ed ottenuti dal progetto OpenBeacon (http://www.openbeacon.org/). In figura 1.1 viene mostrata l'immagine di un tag RFID. 11
  • 12. Fig.1.1: Viene mostrato come si presenta un tag RFID. 1.2 Tracce di mobilità Studiare le interazioni sociali di prossimità e gli schemi di comportamento tra individui, analizzando tracce di mobilità reali, permette di fare luce su diversi fenomeni studiati in varie aree di ricerca. A tal fine può risultare utile analizzare collezioni di dati raccolte e rese disponibili dal mondo accademico, oppure, come è stato fatto nel lavoro di tesi, condurre esperimenti dove vengono collezionate tracce di contatti utilizzando una piattaforma RFID-based. Nei prossimi quattro sottoparagrafi saranno illustrati rispettivamente, i data sets forniti dalla Community Resource for Archiving Wireless Data di Dartmouth (CRAWDAD) [43], i data sets raccolti durante gli esperimenti SocioPatterns [36], i dati collezionati nel progetto SocialDIS [44] presso il Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza Università di Roma, e quelli ottenuti nel progetto MACRO [45] svoltosi presso il museo d'arte contemporanea di Roma MACRO. Questi ultimi due data set sono stati collezionati utilizzando i dispositivi ottenuti dal progetto OpenBeacon (http://www.openbeacon.org/), 12
  • 13. in collaborazione con il Wireless Sensor Network group [46] del Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza Università di Roma. 1.2.1 CRAWDAD La Community Resource for Archiving Wireless Data di Dartmouth (CRAWDAD) [43] è un gruppo di ricerca, che ha costruito un repository (raggiungibile al seguente sito http://crawdad.cs.dartmouth.edu/data.php), dove vengono fornite trace di mobilità a chiunque lavori nell'ambito delle reti wireless o con dispositivi mobili. Questa raccolta contiene decine di dataset, ma solo quelli che descriveremo raccolgono tracce di contatti, utili per l'analisi della mobilità di individui. Cambridge/Haggle Nell'articolo [48] è stato descritto un esperimento che ha coinvolto 41 partecipanti presso la conferenza INFOCOM 2005 a Miami. Nello studio è stato mostrato che le distribuzioni degli intervalli di tempo durante il quali due nodi possono comunicare, hanno un andamento di tipo power-law. Per collezionare le tracce di contatti è stata utilizzata la tecnologia Bluetooth, di cui sono forniti i dispositivi Intel iMote. Tali dispositivi, costituiti da un processore ARM, una radio Bluetooth e una memoria flash, sono stati confezionati e distribuiti a volontari, che si sono impegnati a trasportarli durante il loro spostamenti per tutta la durata della conferenza. Le tracce dei contatti degli individui sono state collezionate eseguendo la procedura di inquiry, ossia l'identificazione, da parte di un dispositivo, dei vicini che si trovano nel suo raggio di copertura. Lo stato di inquiry dura cinque secondi, dopo i quali il dispositivo entra in modalità standby per 120 secondi, più ±12 secondi, valore scelto estraendo un numero casuale da una distribuzione uniforme. Il numero di secondi casuali serve ad evitare che due dispositivi possano eseguire l'inquiry simultaneamente senza riuscire a vedersi l'uno con l'altro. Quando viene rilevato un contatto, vengono registrati gli indirizzi MAC dei due dispositivi che hanno comunicato, il tempo in cui avviene l'interazione e il tempo in cui la comunicazione termina. 13
  • 14. MIT/Reality Mining Nathan Eagle nell'articolo [49], per ottenere gli indirizzi MAC di cellulari Bluetooth ha sviluppato l'applicazione BlueAware, un software che registra i timestamp e gli indirizzi MAC dei dispositivi che si trovano in prossimità l'uno dell'altro, nello specifico di 60 cellulari con sistema operativo Symbian. L'applicazione riceve dal dispositivo Bluedar, un cellulare posizionato nell'ambiente di studio che scansiona tutti i dispositivi visibili nel raggio di 25m, gli indirizzi MAC, attraverso una rete 802.11b. L'esperimento Reality Mining ha collezionato dati da 100 smartphone Nokia 6600 per nove mesi, scaricabili sia dal repository del CRAWDAD, sia dal sito del progetto (http://reality.media.mit.edu). 1.2.2 SocioPattern La Piattaforma RFID-based SocioPatterns ha collezionato tracce di mobilità, disponibili sul sito web http://www.sociopatterns.org/dataset/, in diversi ambienti e contesti. Bisogna tenere presente, che la piattaforma SocioPatterns non effettua un tracciamento delle traiettorie e delle localizzazioni spaziali accurato, ma si focalizza sul raccogliere accuratamente i contatti di prossimità tra individui, basandosi sulle proprietà topologiche e temporali della mobilità dei nodi. Questa piattaforma rileva e registra i contatti tra nodi solo attraverso lo scambio di pacchetti dati a bassa potenza, come descritto nel paragrafo 1.2. Infectious SocioPatterns dynamic contact networks. All'esibizione scientifica Infectus: Stay Away presso la Science Gallery di Dublino, Irlanda, dal 17 aprile al 17 giugno 2009, dove hanno partecipato circa 30000 visitatori, vengono mostrate opere artistiche raffiguranti i meccanismi di contagio di un virus. In questa occasione è stato collezionato un dataset contenente le reti dinamiche di contatti giornaliere. Dal listato 1.1, si osserva che ciascun file è costituito da righe nella forma “𝑡 𝑖 𝑗“, dove 𝑖 e 𝑗 sono gli ID anonimi delle persone che sono entrate in contatto, e l'intervallo durante il quale il contatto è attivo è [ 𝑡 − 20𝑠, 𝑡 ]. Se in un dato intervallo ci sono più contatti attivi, nel file verranno viste più righe che cominciano con lo stesso valore di 𝑡. Il tempo è misurato in secondi ed espresso nel formato UNIX time. Questo dataset è la controparte dinamica della rete di contatti aggregata 14
  • 15. giornalmente, disponibile in formato GML (Graph Modelling Language) [48], un formato di file di testo che rappresenta grafi con una sintassi veramente semplice. Nel listato 1.2 ne viene fornito un semplice esempio, dove si definisce un grafo costituito da tre nodi A, B e C collegati da due archi che collegano B ad A e C ad A. Primary school. In una scuola elementare a Lione, Francia, dal 1 al 2 Ottobre 2009, sono stati raccolti dati sulle interazioni face-to-face tra 232 bambini e 10 insegnanti distribuiti in 10 aule. I dataset comprendono due reti pesate di contatti avvenuti tra studenti ed insegnati, ciascuna per ognuno dei due giorni. Ciascuna rete di contatti giornaliera è costituita da: i nodi, che sono gli individui e gli archi, che rappresentano le interazioni face-to-face. I nodi hanno un attributo che indica la classe di appartenenza dell'individuo, ad esempio gli insegnanti hanno assegnato il valore "Teacher". Gli archi tra il nodo A e il nodo B hanno due pesi associati: durata, che è il tempo totale per cui A e B hanno avuto un contatto durante una singola giornata, misurato in secondi; contatore, che è il numero di volte che il contatto tra A e B è avvenuto durante una giornata scolastica. Le reti sono scaricabili come due file GEXF (Graph Exchange XML Format, http://gexf.net/), uno per ogni giorno di raccolta. Questo formato sarà descritto in modo più approfondito nel capitolo 3, quando verrà illustrato un nuovo formalismo ideato e sviluppato nel lavoro di tesi. Hypertext 2009 dynamic contact network. Alla ventesima edizione della ACM Conference on Hypertext and Hypermedia (HT09) a Torino, dal 29 giugno al 1 luglio 2009, dove il team del SocioPatterns project ha installato l'applicazione Live Social Semantics [39]. I partecipanti alla conferenza hanno volontariamente indossato dei radio badge che monitorano i loro contatti di prossimità. Il dataset pubblicato sul sito del progetto, che rappresenta la rete dinamica di contatti di ~110 partecipanti, è costituito da due file:  Contact List: è una lista separata da tabulazioni che rappresenta i contatti attivi durati intervalli di 20 secondi. Ciascuna riga del file ha la forma “𝑡 𝑖 𝑗“, dove 𝑖 e 𝑗 sono gli ID anonimi delle persone che sono entrate in contatto, e l'intervallo 15
  • 16. durante il quale il contatto è attivo è [ 𝑡 − 20𝑠, 𝑡 ]. Se in un dato intervallo ci sono più contatti attivi, nel file verranno viste più righe che cominciano con lo steso valore di 𝑡. Il tempo è misurato in secondi ed espresso nel formato UNIX time.  Contact Intervals: è un file in formato JSON (http://www.json.org/) che contiene un dizionario, dove ciascuna chiave è l'ID di una persona e il corrispondente valore è il dizionario dei vicini di quella persona. Il dizionario dei vicini ha una chiave con l'ID della persona e per ogni chiave, il valore relativo è la lista di intervalli temporali durante i quali il corrispondente contatto è attivo. Nel listato 1.3 viene mostrato un esempio. 1240913019 78577671 77922321 1240913019 78577671 96403467 1240913019 77922321 96403467 1240913039 78577671 77922321 1240913039 77922321 96403467 1240913059 78577671 77922321 1240913059 77922321 96403467 1240913079 78577671 77922321 1240913079 77922321 96403467 1240913099 96403467 77922321 1240913099 96403467 78577671 1240913099 77922321 78577671 1240913179 77922321 96403467 Listato.1.1: Viene mostrato un frammento del file contenente la lista di contatti dinamici del 28/04/2009, collezionati durante l'esibisione Infectus: Stay Away. graph [ node [ id A ] node [ id B ] node [ id C ] edge [ 16
  • 17. source B target A ] edge [ source C target A ] ] Listato.1.2: Questo semplice codice mostra come definire un grafo di tre nodi e due archi. "1144": { "1336": [[203800, 203820]], "1214": [[192300, 192320], [192400, 192420], [192500, 192600], "1215": [[207600, 207620]], "1155": [[181620, 181640]], "1204": [[194040, 194060]], "1149": [[44920, 44940], [54840, 54860], [86680, 86700 [88360, 88380]], "1228": [[100680, 100700]], "1191": [[195320, 195340]], "1360": [[106560, 106580], [106620, 106700], [146640, 146660]] }, Listato.1.3: Esempio rappresentazione di grafo dinamico tramite il formato JSON. 1144 è la chiave che identifica una persona. Il valore associato alla chiave contiene la lista degli ID dei suoi vicini. Per ogni chiave rappresentante l'ID del vicino e associato come valore la lista degli istanti temporali in cui c'è stato il corrispettivo contatto. 1.2.3 SocialDIS Il primo esperimento che è stato condotto, chiamato da ora in poi SocialDIS, si è svolto al primo piano del Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza Università di Roma. A partire dal 17/10/2011 sono stati tracciati per quattro giorni, in modo assolutamente anonimo, i movimenti e i contatti di prossimità tra gli studenti che si sono offerti volontari. Hanno aderito all'esperimento circa 120 studenti, che hanno indossato un tag RFID attivo per tutta la durata della loro permanenza nel dipartimento. Come viene mostrato in figura 1.2, sono stati installati 20 lettori RFID al primo piano dell'edificio, distribuendoli in tutte le aule, nella segreteria, nella sala studio, nella 17
  • 18. presidenza e nel dispaccio (stanza dove vengono venduti cibi e bevande agli studenti). Fig.1.2: La figura mostra come gli RFID reader, identificati dai pallini neri, siano posizionati nelle in tutte le stanze e nei corridoi del primo piano del primo piano del Dipartimento di Ingegneria informatica automatica e gestionale Antonio Ruberti della Sapienza Università di Roma. I pallini azzurri identificano gli studenti che si trovano in prossimità dei lettori di tag RFID ad un determinato istante temporale. I tag RFID indossati dagli studenti, periodicamente diffondono in broadcast pacchetti radio a bassa frequenza contenenti informazioni riguardo, la loro posizione e i contatti ravvicinati che hanno con uno o più individui. I dispositivi, che sono stati fatti indossare agli individui, sono stati sviluppati dal progetto OpenBeacon (http://www.openbeacon.org). Quando un tag RFID rileva un contatto con un altro tag, ossia due studenti si trovano uno di fronte all'altro ad una distanza che va da 1 a 1.5 m, invia un messaggio ad alta potenza verso il reader più vicino. Questo pacchetto dati contiene un time stamp, l'id del reader che lo ha ricevuto e l'id dei tag che hanno partecipato nell'interazione. Il messaggio ricevuto dai reader viene memorizzato localmente ed inoltrato tramite rete LAN (Local Area Network) ad un server centrale, che colleziona e memorizza i dati, processabili successivamente offline. Alla fine 18
  • 19. dell'esperimento è stato collezionato un dataset di 250 MB, contenente tutte le interazioni avvenute durante l'esperimento, visualizzabili sotto forma di grafo pesato in figura 1.3. Fig.1.3: Vengono mostrate le interazioni sociali tra gli studenti durante l'esperimento SocialDIS. La grandezza e il colore di un nodo indica il numero di vicini. I nodi piccoli e verdi hanno poche relazioni con gli altri nodi, mentre quelli grandi e blu hanno tante relazioni con gli altri nodi. Lo spessore dell'arco indica quanto frequentemente due persone interagiscono. Un arco sottile indica poche interazioni tra due persone, mentre un arco spesso indica che ci sono state molte interazioni tra due persone. 19
  • 20. Nel grafo ciascun nodo rappresenta un visitatore e ciascun arco rappresenta il contatto avvenuto tra due individui. La grandezza ed il colore di ciascun nodo e il peso ed il colore di ciascun arco rappresentano la rispettiva frequenza, ossia il rapporto tra il numero di secondi in cui esso esiste e la durata totale dell'esperimento. Un esempio di informazione che si può ottenere da tale dataset è: Il tag con id xxxx ha incontrato il tag con id yyyy nella stanza Alpha oppure il tag con id xxxx è vicino alla stanza Beta. In alcun modo possiamo risalire alla vera identità della persona a cui è associato il tag con id xxxx. Inoltre a ciascun studente è stato chiesto di fornirci le seguenti informazioni personali in forma anonima:  Età  Sesso (maschio/femmina)  Status (corso di studi e anno accademico) Con le trace di contatto che sono state ottenute dall'esperimento possiamo analizzare le relazioni tra individui: analizzare gli spazi condivisi (aule, corridoi, segreteria), analizzare le relazioni tra studenti, ad esempio individuando la formazione di comunità o cluster. Nel capitolo 5 si vedrà, utilizzando le metriche definite e descritte nel capitolo 3, se i modelli di mobilità (descritti nel capitolo 2) generano grafi dinamici, con proprietà topologiche e temporali vicine a quelle possedute dal grafo dinamico ottenuto dal dataset empirico relativo all'esperimento condotto. Per quanto concerne il tracciamento della mobilità degli studenti, precisiamo che, non effettuiamo un tracciamento delle traiettorie e delle localizzazioni spaziali accurato, ma raccogliamo solamente i contatti di prossimità tra individui. Possiamo solamente conoscere la posizione dello studente, ossia in che stanza o corridoio si trova, in base a quale lettore RFID riceve il segnale ad alta potenza inviato dal tag. 1.2.4 MACRO Il 20 Giugno 2012 è stato effettuato un secondo esperimento simile a SocialDIS, presso il museo d'arte contemporanea di Roma MACRO, chiamato da ora in poi NeonMACRO. Durante la mostra d'arte NEON, sono stati tracciati in modo completamente anonimo i movimenti dei visitatori (ad esempio, quale opera un 20
  • 21. visitatore sta guardando e per quanto tempo), i contatti di prossimità tra i visitatori che hanno accettato di partecipare all'esperimento. I circa 120 visitatori aderenti all'iniziativa, hanno indossato un tag RFID attivo per tutta la durata della loro visita nella sala Enel del museo. Come viene mostrato in figura 1.4, sono stati installati 8 lettori RFID nella sala espositiva, posizionandoli vicino le opere d'arte principali. I tag RFID indossati dai visitatori, come nell'esperimento SocialDIS, periodicamente diffondono in broadcast pacchetti radio a bassa frequenza contenenti informazioni riguardo, la loro posizione e i contatti ravvicinati che hanno con uno o più soggetti. Anche in questo caso, i dispositivi sono stati ottenuti dal progetto OpenBeacon (http://www.openbeacon.org). Fig.1.4: La figura mostra come gli RFID reader, identificati dai pallini neri, siano posizionati le opere d'arte esibite al museo d'arte contemporanea di Roma MACRO. 21
  • 22. Quando due visitatori si trovano uno di fronte all'altro ad una distanza che va da 1 a 1.5 m, il rispettivo tag indossato rileva il contatto ed invia un messaggio ad alta potenza verso il reader più vicino. Il pacchetto dati inviato, contiene un time stamp, l'id del reader che lo ha ricevuto e l'id dei tag che hanno partecipato nell'interazione. Il messaggio ricevuto dai reader viene, anche questa volta, memorizzato localmente ed inoltrato tramite rete LAN (Local Area Network) ad un server centrale, collocato in quella che viene chiamata "Area", un open space del museo dove i visitatori possono rilassarsi, conoscere altre persone e condividere idee. Il server colleziona e memorizza i dati, che saranno successivamente processati ed analizzati offline. Alla termine dell'esperimento è stato raccolto un dataset di 10 MB. In figura 1.5 possiamo visualizzare, sottoforma di grafo pesato, tutte le interazioni tra visitatori avvenute durante l'esperimento. Fig.1.5: Vengono mostrate le interazioni sociali tra le persone durante l'esperimento NeonMACRO. I visitatori più sociali sono rappresentati da cerchi grandi e di colore scuro. Lo spessore degli archi dipende dalla frequenza con cui avviene l'interazione tra due visitatori. 22
  • 23. Ciascun nodo rappresenta un visitatore e ciascun arco rappresenta il contatto avvenuto tra due individui. La grandezza di ciascun nodo e il peso di ciascun arco rappresentano la rispettiva frequenza, ossia il rapporto tra il numero di secondi in cui esso esiste e la durata totale dell'esperimento. Questo permette di visualizzare immediatamente nel grafo quali siano i visitatori più socievoli e quelli meno socievoli. A ciascun visitatore è stato chiesto di fornire le seguenti informazioni in forma anonima:  Età  Sesso (maschio/femmina)  Titolo di studio  Area professionale  Nazionalità (Italiano o non Italiano)  Gruppo (se un visitatore è entrato nella sala accompagnato da altre persone, a ciascun membro del gruppo viene associato l'identificativo del gruppo ) La raccolta di queste ulteriori informazioni ha permesso di effettuare delle semplici ed immediate analisi sul comportamento dei visitatori. In figura 1.6 si possono visualizzare le interazioni tra gruppi di visitatori. In figura 1.7 si può osservare, il grafo pesato rappresentante tutte le interazioni tra i visitatori (classificati per età) e le opere d'arte, mentre in figura 1.8 il grafo pesato raffigura tutte le interazioni tra i visitatori (classificati per titolo di studio) e le opere d'arte. Nel capitolo 5 si vedrà, utilizzando le metriche definite e descritte nel capitolo 2, se i modelli di mobilità (descritti nel capitolo 2) generano grafi dinamici, con proprietà topologiche e temporali vicine a quelle possedute dal grafo dinamico ottenuto dal dataset empirico relativo all'esperimento condotto. Anche in questo caso il tracciamento della mobilità dei visitatori, non raccoglie le traiettorie e le localizzazioni spaziali in maniera accurata, ma raccoglie solamente i contatti di prossimità tra individui. Si possono solamente conoscere la posizione del visitatore, ossia in che posizione della sala Enel si trova (o che opera d'arte stia guardando), in base a quale lettore RFID riceve il segnale ad alta potenza inviato dal tag indossato. 23
  • 24. Fig.1.6: Il grafo mostra le interazioni fra i gruppi di visitatori. Ciascun nodo rappresenta un gruppo costituito dalle persone entrate in sala accompagnate. 24
  • 25. Fig.1.7: Il grafo mostra le interazioni tra i visitatori e le opere d'arte. I pallini scuri e grandi rappresentano le opere d'arte, mentre i pallini colorati più piccoli rappresentano i visitatori, che sono stati classificati in base alla loro età, compresa tra 0-9, 10-19, 20-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80 e più anni. 25
  • 26. Fig.1.8: Il grafo mostra le interazioni tra i visitatori e le opere d'arte. I pallini scuri e grandi rappresentano le opere d'arte, mentre i pallini colorati più piccoli rappresentano i visitatori, che sono stati classificati in base al titolo di studio (Master, Bachelor, High School, Ph.D., Primary School e Mid School).  26
  • 27. Capitolo 2 Mobility Models Nel precedente capitolo sono state descritte le tecnologie con le quali vengono collezionati i dataset empirici, ossia dati che mostrano i comportamenti reali dei dispositivi mobili (nel nostro caso tag RFID). In questo capitolo verrà definito cosa sono invece i dataset sintetici (o Synthetic dataset), dati generati usando i modelli di mobilità, ed saranno illistrativi modelli che tentano di riprodurre il comportamento dei dispositivi mobili, senza usare tracce di mobilità reali. I Synthetic data sono secondo il McGraw-Hill Dictionary of Scientific and Technical Terms [12] "qualunque raccolta di dati applicabile a una data situazione, che non sia ottenibile tramite una misurazione diretta". Catturare i movimenti di individui (o nodi mobili) permette di osservare gli schemi di comportamento presenti in sistemi di vita reale. Il processo di tracciamento però, è un'operazione difficile da fare quando viene coinvolto un gran numero di persone e l'osservazione viene eseguita per lunghi periodi di tempo. I protocolli e le applicazioni per le reti mobili non sono facilmente modellabili e le loro performance non sono facilmente valutabili se non si conoscono i movimenti degli individui, che verranno chiamati da ora user trace. Se si vogliono produrre delle user trace senza ricorrere a complesse infrastrutture per collezionare i dati (ad esempio la piattaforma SocioPatters illustrata nel capitolo 1), è necessario utilizzare i synthetic models. I Synthetic models rappresentano realisticamente il comportamento di nodi mobili senza aver bisogno di catturare user trace dal mondo reale. Tracy Camp nell'articolo [13] presenta diversi modelli di mobilità, che sono stati utilizzati per valutare le performance di protocolli per reti ad hoc. L'autore enfatizza il bisogno di sviluppare modelli di mobilità accurati per rappresentare realisticamente i movimenti di utenti mobili, esplorando le limitazioni delle strategie adottate dai modelli attualmente utilizzati. Egli classifica i modelli di mobilità in due tipi: individual mobility models e group mobility models. 27
  • 28. Gli Individual mobility models o memoryless models [14],[15] descrivono nodi le cui azioni sono indipendenti l'uno dall'altro. Questi semplici modelli sono i più usati per valutare reti mobili wireless, in cui ogni dispositivo è indipendente dagli altri e quindi non esistono correlazioni nei comportamenti. I group mobility models [16],[17],[18] sono invece più complessi e meno utilizzati, e rappresentano il comportamento di nodi dipendenti l'uno dall'altro. Nei prossimi paragrafi saranno decritti i seguenti Individual mobility models, i più famosi ed utilizzati nel simulare il comportamento delle reti mobili ad hoc: 1. Random Walk Mobility Model: modello in cui i nodi mobili seguono direzioni casuali con velocità scelte in modo casuale. 2. Random Waypoint Mobility Model: modello che tiene conto di un tempo di pausa, prima che il nodo cambi direzione e velocità. 3. Random Direction Mobility Model: modello in cui i nodi mobili devono arrivare alla fine dell'area di simulazione prima di poter cambiare la direzione e la velocità. 4. Truncated Lévy Walk Mobility Model: modello dove le human walks del caso reale sono approssimate con quelle che vengono chiamate, Lévy walks. 5. Boudless Simulation Area Mobility Model: modello che trasforma l'area di simulazione da rettangolare 2D a forma toroidale. 6. Gauss-Markov Mobility Model: modello in cui gli schemi di mobilità possono essere resi più o meno casuali regolando un parametro. 7. Versione probabilistica del Random Walk Mobility Model: modello che utilizza un insieme di probabilità per determinare la prossima posizione di un nodo mobile. 8. Weighted Waypoint Mobility Model: modello in cui i nodi mobili scelgono la propria destinazione secondo una certa probabilità, che dipende dalla posizione corrente, dal tempo e dalla "popolarità" della zona da raggiungere. Illustreremo anche i seguenti group mobility models: 1. Exponential Correlated Random Mobility Model: modello dove i movimenti seguono una funzione di movimento. 2. Column Mobility Model: modello dove un insieme di nodi forma una linea che si muove uniformemente lungo una specifica direzione. 28
  • 29. 3. Nomadic Community Mobility Model: modello dove un insieme di nodi si muove da un luogo ad un altro, mantenendo una certa libertà di movimento all'interno del gruppo. 4. Pursue Mobility Model: modello dove un insieme di nodi insegue un determinato nodo. 5. Reference Point Group Mobility Model: modello dove i movimenti delle comunità sono basati sul percorso che attraversa un centro logico. 2.1 Individual mobility models Verrano descritti ora i modelli di mobilità in cui ciascun nodo ha un comportamento indipendente rispetto a quello degli altri nodi. 2.1.1 Random Walk (RW) Il Random Walk Mobility Model è stato ideato ed illustrato per la prima volta da Einstein nel 1926 [50]. Il modello si basa sul moto browniano, ossia sul movimento disordinato e casuale delle particelle (aventi diametro dell'ordine del micrometro) presenti in fluidi o sospensioni fluide. In questo modello di mobilità, viene inizialmente definita un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 ed il numero totale di nodi 𝑁. Ciascun nodo si muove dalla sua posizione corrente alla sua posizione successiva scegliendo casualmente una direzione e una velocità con cui viaggiare. Il valore della velocità viene scelto da una distribuzione e può essere compreso tra un valore minimo e un valore massimo 𝑠𝑝𝑒𝑒𝑑𝑚𝑖𝑛, 𝑠𝑝𝑒𝑒𝑑𝑚𝑎𝑥 . Anche la direzione viene scelta casualmente da una distribuzione uniforme con valori compresi tra 0, 2𝜋 . Ogni passo di simulazione termina dopo un tempo prestabilito t o dopo una certa distanza d, alla fine delle quali ciascun nodo sceglie una nuova direzione e velocità. Del Random Walk Mobility Model sono state derivate altre versioni, chiamate d-D walks, dove d rappresenta il numero di dimensioni dell'area di simulazione. Quello che abbiamo descritto è la versione 2-D. Questo modello è memoryless perché non tiene traccia della posizione e della velocità passata dei nodi mobili. La velocità e la direzione correnti di un nodo mobile, sono indipendenti da quelle passate. In 29
  • 30. figura 2.1 (ottenuta dal sito http://paginas.fe.up.pt/~ee03058/stat_art.html) osserviamo che questa caratteristica può generare movimenti umani irrealistici. Fig.2.1: Esempio di come si muove un nodo mobile usando il Random Walk Mobility Model versione 2-D. Se il tempo 𝑡 o la distanza 𝑑, che definiscono quanto dura un passo della simulazione, sono troppo corti, i nodi si muovono solo in una piccola parte dell'area di simulazione, generando uno schema di movimento adatto all'analisi di reti semi statiche. Pertanto se si vogliono invece analizzare reti dinamiche, dobbiamo scegliere grandi valori per 𝑡 e 𝑑. 2.1.2 Random Waypoint (RWP) Uno dei modelli di mobilità più popolari ed utilizzati è il Random Waypoint model (RWP). Questo modello di mobilità è un semplice modello stocastico che descrive come si muovono i nodi in una rete mobile in una data area. In questo modello di mobilità viene definita un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 e stabilito il numero totale di nodi 𝑁. Ciascun nodo viene casualmente posizionato nell'area in un punto (𝑥, 𝑦), dove 𝑥 e 𝑦 sono entrambi uniformemente distribuiti rispettivamente su 0, 𝑋 𝑚𝑎𝑥 e 0, 𝑌 𝑚𝑎𝑥 . A ciascun nodo vengono assegnati un punto di arrivo o destinazione (𝑥0 , 𝑦0 ), casualmente scelto tra i punti dell'area, e una velocità v, che è 30
  • 31. casualmente scelta da una distribuzione uniforme in un intervallo compreso tra 𝑚𝑖𝑛𝑠𝑝𝑒𝑒𝑑, 𝑚𝑎𝑥𝑠𝑝𝑒𝑒𝑑 . Un nodo inizia a muoversi verso la destinazione con velocità v. Arrivato al punto di arrivo (𝑥0 , 𝑦0 ), il nodo rimane li per un tempo p, chiamato waiting time, che è casualmente scelto da una distribuzione uniforme. Terminato il waiting time, vengono scelte una nuova destinazione e una nuova velocità nello stesso modo e il processo si ripete fino a che non termina la simulazione. In figura 2.2 (ottenuta dal sito http://www.emeraldinsight.com) come il comportamento di un nodo in un area di simulazione che misura 1000 x 1000 m. Fig.2.2: Esempio di come si muove un nodo mobile usando il Random Waypoint Mobility Model in un'area 1000 x 1000 m. Se al modello si assegna a ciascun nodo un waiting time pari a zero e 𝑚𝑖𝑛𝑠𝑝𝑒𝑒𝑑, 𝑚𝑎𝑥𝑠𝑝𝑒𝑒𝑑 = 𝑠𝑝𝑒𝑒𝑑𝑚𝑖𝑛, 𝑠𝑝𝑒𝑒𝑑𝑚𝑎𝑥 , il Random Waypoint Mobility Model diventa simile al Random Walk Mobility Model. Il modello presenta il seguente problema [13]: ciascun nodo mobile viene posizionato in modo casuale nell'area di simulazione, non rappresentando in modo realistico il modo in cui i nodi si distribuiscono quando si muovono. In [13] viene mostrato che nel modello si attenua il problema della posizione iniziale dopo circa 600 secondi di simulazione e che esistono tre possibili soluzioni per evitare l'inaccuratezza del modello, dovuta alla posizione iniziale dei nodi. La prima soluzione è salvare le posizioni dei nodi al termine di una simulazione durata più di 600 secondi ed utilizzarle come posizioni iniziali nelle 31
  • 32. simulazioni successive. La seconda è scegliere la posizione iniziale secondo una distribuzione di probabilità che rappresenta meglio la realtà che vogliamo simulare. La terza consiste nello scartare i primi 1000 secondi di simulazione. La terza soluzione è migliore della prima, perché garantisce che ciascuna simulazione abbia un inizializzazione esente dal problema appena trattato. Nel Random Waypoint Mobility Model esiste una correlazione tra la velocità e il tempo di pausa di un nodo. Ad esempio, se nella simulazione i nodi percorrono l'area a velocità elevate ed hanno dei tempi di pausa lunghi, vengono prodotte reti più stabili rispetto al caso in cui, i nodi si muovono lentamente e aspettano poco tempo. La distribuzione spaziale dei nodi incide sul numero di vicini che essi possono avere, perché i nodi che sono vicini al bordo dell'area di simulazione, hanno maggiore probabilità di scegliere una destinazione che si trovi verso il centro dell'area, dove la probabilità di incontrare nodi cresce, mentre quando si trovano sul bordo dell'area la probabilità di incontrare nodi decresce. Queste variazioni di densità (chiamate density wave) del numero medio di vicini in base alla zona, vengono risolte nel modello descritto nel prossimo paragrafo. 2.1.3 Random Direction (RD) Il Random Direction Mobility Model (RD)descritto in [52], è stato ideato per evitare le variazioni del numero medio di vicini che si hanno in base alla zona dell'area di simulazione raggiunta da un nodo mobile, che avvengono nel modello RWP. I quest'ultimo modello è stato visto che la probabilità con cui un nodo sceglie una nuova destinazione localizzata nel centro dell'area di simulazione, o che richiede l'attraversamento di essa, è alta. Pertanto il modello RD cerca di evitare il più possibile di diminuire questa probabilità, facendo in modo che i nodi si trovino con maggiore probabilità vicino i bordi dell'area di simulazione. Come visto modello precedentemente illustrato, anche ora viene definita un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 ed il numero totale di nodi 𝑁. Ciascun nodo viene casualmente posizionato nell'area in un punto (𝑥, 𝑦), dove 𝑥 e 𝑦 sono entrambi uniformemente distribuiti rispettivamente su 0, 𝑋 𝑚𝑎𝑥 e 0, 𝑌 𝑚𝑎𝑥 . A ciascun nodo viene assegnata una velocità v, casualmente scelta da una distribuzione uniforme in un intervallo compreso tra 𝑚𝑖𝑛𝑣, 𝑚𝑎𝑥𝑣 e un angolo di direzione, scelto casualmente da una distribuzione uniforme con valori compresi tra 32
  • 33. 0, 2𝜋 , come avviene nel modello RW. Ciascun nodo dopo aver scelto la direzione, la segue fino ad arrivare al bordo dell'area di simulazione con velocità 𝑣. Quando un nodo raggiunge il bordo si ferma per un tempo chiamato waiting time, casualmente scelto da una distribuzione uniforme. Terminato il waiting time, vengono scelte una nuova destinazione e una nuova velocità nello stesso modo e il processo si ripete fino a che non termina la simulazione. Dato che i nodi restano per molto tempo sui bordi dell'area di simulazione, la distanza media tra i nodi risulta maggiore rispetto agli altri modelli, per questo motivo un pacchetto dati o un informazione, raggiunge un nodo attraversando un numero medio di hop maggiore rispetto agli altri modelli. Dunque la rete ottenuta dalla simulazione risulta partizionata. Per diminuire tale problema, è stata ideata una versione modificata del modello RD, descritta in [51], in cui i nodi mobili continuano a scegliere casualmente una direzione, ma non devono raggiungere necessariamente il bordo dell'area di simulazione affinchè si fermino ed aspettino il waiting time, per poi ripartire per una nuova direzione. Questa modifica rende il modello RD identico al modello RW con il waiting time. 2.1.4 Truncated Lèvi Walk (TLW) Gli schemi di mobilità degli esseri umani vengono tipicamente approssimati con il modello RW (descritto nel paragrafo 2.1.1) o RWP (illustrato nel paragrafo 2.1.2). Attraverso delle misurazioni fatte in natura si è osservato che le traiettorie seguite dagli animali sono approssimabili a un Lévy flight [19], definito da Schlesinger [60], come il più lungo viaggio che una particella segue in linea retta, da un luogo ad un altro, senza cambiare direzione o tempo di pausa. Queste osservazioni sono state poi generalizzate al caso umano nello studio descritto in [20], dove, catturando tramite tecnologia GPS le user trace di 44 volontari distribuiti in diversi ambienti outdoor (campus universitari, metropolitane, parchi), si è riscontrato che le human walks hanno delle forti correlazioni statistiche con le Lévy walks. Gli autori enfatizzato il fatto che le somiglianze possono essere solo di tipo statistico, perché gli umani si muovono in base all'attività che devono svolgere o alle loro preferenze, dunque non possono spostarsi in modo casuale. 33
  • 34. In figura 2.5 si nota che, le Lévy walks [20] sono un insieme di tanti flight corti e rari flight lunghi e che le tracce di mobilità risultano essere più realistiche di quelle ottenute dai modelli di mobilità RW e RWP. Nello studio è stato scoperto che, le flight distribution e le waiting time distribution dei partecipanti all'esperimento, sono truncated power-law distribution, e che la Inter contac time (ITC) distribution delle human walk mostra un comportamento di tipo power-law [22]. Fig.2.5: Esempio di user trace ottenuta da (a) Levy walks, (b) RWP e (c) RW. Usando tali risultati, Hong in [21] ha sviluppato il Truncated Levy Walk model (TLW), ossia una variante del modello RWP (illustrato nel paragrafo 2.1.2), con le seguenti caratteristiche:  Le lunghezze dei flight seguono una truncated power law con esponente 𝛼: − 1+𝛼 𝑝 𝑙 ~ 𝑙 ,𝑙< 𝑙 𝑚𝑎𝑥 ;  i waiting times seguono una truncated power law con esponente 𝛽: 𝜓 𝑡 ~𝑡 − 1+𝛽 , 0 < 𝑡 < 𝑡 𝑚𝑎𝑥 ;  l'angolo di direzione segue una distribuzione uniforme compresa tra 0,2𝜋 ;  la velocità cresce in modo proporzionale rispetto lunghezza del flight; 2.1.5 Boundless Simulation Area (BD) Il Boundless Simulation Area Mobility Model, non è memoryless, ossia esiste una relazione tra la direzione e la velocità di un nodo nel tempo passato e la direzione e velocità del nodo correnti [55]. Definita un area'rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 ed il numero totale di nodi 𝑁, la velocità di un nodo mobile è descritta da un vettore 𝑣 = 𝑣, 𝜃 , dove v è la velocità e 𝜃 è la direzione. Ciascun nodo viene 34
  • 35. casualmente posizionato nell'area in un punto (𝑥, 𝑦). Ad ogni passo della simulazione, di durata ∆𝑡, la velocità e la posizione di ogni nodo viene aggiornata secondo le seguenti equazioni: 𝑣 𝑡 + ∆𝑡 = 𝑚𝑖𝑛 𝑚𝑎𝑥 𝑣 𝑡 + ∆𝑣, 0 , 𝑉𝑚𝑎𝑥 𝜃 𝑡 + ∆𝑡 = 𝜃 𝑡 + ∆𝜃 𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + 𝑣 𝑡 ∗ 𝑐𝑜𝑠𝜃 𝑡 𝑦 𝑡 + ∆𝑡 = 𝑦 𝑡 + 𝑣 𝑡 ∗ 𝑠𝑖𝑛𝜃 𝑡 dove 𝑉𝑚𝑎𝑥 è la massima velocità definita nella simulazione, ∆𝑣 è la variazione di velocità che è uniformemente distribuita tra −𝐴 𝑚𝑎𝑥 ∗ ∆𝑡, 𝐴 𝑚𝑎𝑥 ∗ ∆𝑡 , 𝐴 𝑚𝑎𝑥 è la massima accelerazione che può raggiungere un nodo, ∆𝜃 è la variazione di direzione che è uniformemente distribuita tra −𝛼 ∗ ∆𝑡, 𝛼 ∗ ∆𝑡 , e 𝛼 è la massima variazione di angolo nella direzione percorsa dal nodo. Dalla figura 2.3 (ottenuta dal sito web http://www-public.it-sudparis.eu/~gauthier/MobilityModel/mobilitymodel.html) si osserva che a differenza dei modelli illustrati nei paragrafi precedenti, i nodi possono continuare il loro percorso superando i confini dell'area di simulazione, riapparendo nel lato opposto dell'area di simulazione. 35
  • 36. Fig.2.3: Esempio di come si muove un nodo mobile, che parte dal punto (≅390,≅290), usando il Boundless Simulation Area Mobility Model in un area di 1000 x 300 m. In figura 2.4 si vede che questa tecnica crea un area di simulazione toroidale, dove i nodi possono viaggiare senza confini. Fig.2.4: La figura mostra che nel Boundless Simulation Area Mobility Model l'area di simulazione di forma rettangolare, viene trasformata in una forma toroidale. 2.1.6 Gauss-Markov (GM) Il Gauss-Markov Mobility Model è stato implementato in [56]. A ciascun nodo, che si muove in un'area rettangolare di dimensione 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 , viene assegnata una velocità e una direzione iniziale, che viene aggiornata ad ogni intervallo di tempo fisso 𝑛. Il valore aggiornato nell'n-esima istanza è calcolato in base al valore della n-1 esima istanza, e al valore di una variabile casuale, usando le seguenti equazioni: 𝑠 𝑛 = 𝛼𝑠 𝑛−1 + 1 − 𝛼 𝑠 + 1 − 𝛼 2 𝑠 𝑥 𝑛 −1 𝑑 𝑛 = 𝛼𝑑 𝑛−1 + 1 − 𝛼 𝑑 + 1 − 𝛼 2 𝑑 𝑥 𝑛 −1 dove 𝑠 𝑛 e 𝑑 𝑛 sono, rispettivamente la nuova velocità e la nuova direzione dei nodi nell'intervallo temporale 𝑛; 𝛼, compresa tra −1, 1 , è usata come parametro per regolare la casualità; 𝑠 e 𝑑 sono costanti che rappresentano il valore medio di velocità 36
  • 37. e direzione con 𝑛 → ∞; 𝑠 𝑥 𝑛 −1 e 𝑑 𝑥 𝑛 −1 sono variabili aleatorie prese da una distribuzione Gaussiana. Impostando 𝛼 = 0 otteniamo valori totalmente casuali, mentre con 𝛼 = 1 otteniamo un moto lineare. Assegnando valori intermedi ad 𝛼, si ottengono diversi livelli di casualità. Ad ogni passo della simulazione la posizione successiva di un nodo viene calcolata in base alla posizione, velocità e direzione corrente, seguendo le seguenti equazioni: 𝑥 𝑛 = 𝑥 𝑛−1 + 𝑠 𝑛−1 ∗ 𝑐𝑜𝑠𝑑 𝑛−1 𝑦 𝑛 = 𝑦 𝑛−1 + 𝑠 𝑛−1 ∗ 𝑠𝑖𝑛𝑑 𝑛−1 Dove 𝑥 𝑛 , 𝑦 𝑛 𝑒 𝑥 𝑛−1 , 𝑦 𝑛−1 sono rispettivamente le coordinate x e y dei nodi mobili all'n-esimo e all'n-1 esimo intervallo temporale. In figura 2.5 (dal sito ottenuta dal sito web http://tinyurl.com/8oed5jz) viene mostrato il comportamento di un nodo in un area di simulazione che misura 700 x 1000 m. Fig.2.5: Esempio di come si muove un nodo mobile, che parte dal punto (≅500,≅500), usando il Gauss-Markov Mobility Model in un area di 700 x 1000 m. 37
  • 38. 2.1.7 Probabilistic Random Walk (PRW) Nella tesi di dottorato di Chiang [57] è stato creato un modello di mobilità, chiamato Probabilistic Random Walk Mobility Model, che, utilizzando una matrice di probabilità, determina la posizione di uno specifico nodo mobile, in un'area 𝑋 𝑚𝑎𝑥 × 𝑌 𝑚𝑎𝑥 , in base a tre possibili stati: lo stato 0 rappresenta la posizione corrente, lo stato 1 rappresenta la posizione passata e lo stato 2 rappresenta la posizione futura se il nodo mobile continua a muoversi nella stessa direzione. La matrice di probabilità usata e la seguente: 𝑃(0,0) 𝑃(0,1) 𝑃(0,2) 𝑃 = 𝑃(1,0) 𝑃(1,1) 𝑃(1,2) 𝑃(2,0) 𝑃(2,1) 𝑃(2,2) Dove ciascun valore 𝑃(𝑎, 𝑏) rappresenta la probabilità che un nodo mobile passi dallo stato 𝑎 allo stato 𝑏. Le coordinate x e y di ciascun nodo vengono aggiornate in base ai valori della matrice. Ogni nodo si muove casualmente con una velocità media predefinita. Nella seguente matrice ci sono i valori che Chiang ha usato per calcolare le variazioni nelle coordinate x e y dei nodi: 0 0.5 0.5 𝑃 = 0.3 0.7 0 0.3 0 0.7 In figura 2.6 possiamo vedere la matrice illustrata sotto forma di diagramma di flusso. Per come è configurata la matrice di probabilità, un nodo mobile può andare diretto verso: nord, sud, est o ovest, senza mai prendersi una pausa (wait time = 0). La probabilità che il nodo continui a seguire la stessa direzione è più alta della probabilità che esso la cambi. Inoltre i valori definiti non permettono movimenti tra la precedente e la prossima posizione senza passare per quella corrente. 38
  • 39. Fig.2.6: Diagramma di flusso della versione probabilistica del Random Walk Mobility Model. Questa implementazione del modello produce dei comportamenti di mobilità più realistici del modello RW. Ad esempio una persona che deve eseguire vari compiti giornalieri, tende a muoversi seguendo una direzione semi costante. Raramente gira improvvisamente intorno a dove era, tornando sui suoi passi, e quasi mai si muove casualmente sperando eventualmente di finire in uno dei posti che gli interessano. In figura 2.7 (ottenuta dal sito ottenuta dal sito web http://www- public.it-sudparis.eu/~gauthier/MobilityModel/mobilitymodel.html) viene illustrato un esempio di schema di mobilità di un nodo mobile usando la versione probabilistica del modello RW. Da questa figura si osserva che la user trace ha dei cambiamenti di direzione molto meno variabili di quelli visti per il modello RW in figura 2.1, dunque approssima meglio gli schemi di mobilità degli esseri umani. 39
  • 40. Fig.2.7: Esempio di come si muove un nodo mobile, che parte dal punto (≅500,≅500), usando il Probabilistic Random Walk Mobility Model in un area di 500 x 560 m. 2.1.8 Weighted Waypoint (WW) Il Weighted Waypoint Mobility Model (WW) [64] è una versione del modello RWP, in cui le persone non decidono una destinazione in modo casuale, ma la scelgono in base ad una certa probabilità, che dipende da quanto gli individui tendono a visitarla. Tutti i modelli che sono stati illustrati nei paragrafi precedenti non considerano che all'interno dell'area di simulazione alcune zone sono visitate più spesso rispetto ad altre. In [64] è stato dimostrato che se ne viene tenuto conto, ossia si considera l'esistenza di zone in cui gli individui interagiscono tra di loro per un periodo prolungato, si possono ottenere delle user trace più accurate rispetto al modello RWP. I modelli WW ed RWP si differenziano per : 1. Le persone non scelgono casualmente la destinazione: a ciascuna zona dell'area di simulazione viene assegnato un peso, definito in base alla probabilità di scegliere quel luogo come destinazione. Tale probabilità può 40
  • 41. essere calcolata valutando quanto le zone siano "popolari" nell'ambiente che stiamo tentando di simulare. 2. La probabilità di scegliere una specifica zona come prossima destinazione, dipende dalla posizione corrente e dal tempo: viene usato un modello Markoviano per assegnare tali probabilità. 3. Il waiting time in ciascuna zona, è diverso e dipende dalle proprietà specifiche del luogo. 2.2 Group mobility models Verranno descritti ora i modelli di mobilità in cui i nodi hanno un comportamento che dipende da quello degli altri nodi. Tali modelli risultano essere utili per tracciare user trace che simulano realtà in cui i nodi si muovono in comunità. 2.2.1 Exponential Correlated Random Questo modello di mobilità proposto in [58] data la posizione di un nodo (o un gruppo) al tempo 𝑡, tramite funzione di movimento 𝑏 𝑡 , viene determinata la posizione successiva del nodo (o gruppo) al tempo 𝑡 + 1, con la seguente funzione: 1 1 − 𝑏 𝑡 + 1 = 𝑏(𝑡) 𝑒 𝜏 + 𝜎 1 − (𝑒 − 𝜏 )2 𝑟 dove r è una variabile casuale che segue una distribuzione Gaussiana che ha varianza 𝜎, e 𝜏 regola la velocità di cambiamento del nodo dalla posizione precedente a quella successiva (ad una valore minore di 𝜏 corrisponde un cambiamento più rapido). Il problema principale di questo particolare modello è la difficoltà di assegnare il valore più corretto ai parametri in modo da ottenere lo schema di mobilità che vogliamo. 2.2.2 Column Il Column Mobility Model (http://www.disca.upv.es/misan/mobmodel.htm) è un modello che rappresenta un insieme di nodi mobili che si muovono lungo una data linea (o colonna). Inizialmente viene definita una reference grid, ossia una colonna iniziale di nodi, dove ciascun nodo viene messo in relazione con un punto di riferimento. I nodi si possono muovere attorno al loro punto di riferimento seguendo le regole dettate da un particolare Individual mobility models (ad esempio viene consigliato di 41
  • 42. usare il modello RW, descritto nel paragrafo 2.1.1). Il nuovo reference point per un determinato nodo viene definito come: 𝑛𝑒𝑤 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐 𝑒 𝑝𝑜𝑖𝑛𝑡 = 𝑜𝑙𝑑 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐 𝑒 𝑝𝑜𝑖𝑛𝑡 + 𝑎𝑑𝑣𝑎𝑛𝑐𝑒 𝑣𝑒𝑐𝑡𝑜𝑟 dove 𝑜𝑙𝑑 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐 𝑒 𝑝𝑜𝑖𝑛𝑡 è il punto di riferimento precedente e 𝑎𝑑𝑣𝑎𝑛𝑐𝑒 𝑣𝑒𝑐𝑡𝑜𝑟 un offset angolare scelto in modo casuale che sposta la griglia di riferimento. Quando la griglia viene ruotata con un angolo casuale (compreso tra 0 e 𝜋) e spostata ad una distanza casuale, i nodi mobili, che si muovono seguendo il loro punto di riferimento, seguono la griglia e continuano la loro rotazione attorno al punto. 2.2.3 Nomadic Community Il Nomadic Community Mobility Model (http://www.disca.upv.es/misan/mobmodel.htm) è un modello che rappresenta comunità di nodi che si muovono collettivamente da un punto ad un altro [59]. Ogni comunità o gruppo di nodi, che ha associato un punto di riferimento in comune, si muove attorno al proprio reference point ma, all'interno di ogni gruppo, ciascun nodo mantiene una propria "area personale", dove si muove in modo casuale. Questo modello può essere usato ad esempio per simulare scenari dove una classe di studenti visitano un museo d'arte. Gli alunni della classe si sposteranno da un punto ad un altro insieme, mentre nel punto in cui si trovano si possono muovere individualmente come vogliono (ad esempio secondo un Individual mobility models). Rispetto al modello Column, i nodi all'interno del gruppo sono meno vincolati nella possibilità di movimento. 2.2.4 Pursue Nel Pursue Mobility Model definito in (http://www.disca.upv.es/misan/mobmodel.htm) e in [59], uno dei nodi della rete viene selezionato come nodo target. Il nodo prescelto, che si muove secondo uno degli Individual mobility models, viene seguito dagli altri nodi mobili, eseguendo dei movimenti in direzione di esso, determinati da un randomvector , ossia un offset ottenuto seguendo uno degli Individual mobility models (ad esempio il modello RW, descritto nel paragrafo 2.1.1). La nuova posizione di ciascun nodo viene calcolata utilizzando la seguente equazione: newposition = oldposition + acceleration target − oldposition + randomvector 42
  • 43. dove acceleration target − oldposition è l'informazione relativa al nodo che viene inseguito e randomvector rappresenta l'offset applicato ad ogni nodo. Dunque, per calcolare la prossima posizione di ogni nodo, questo modello utilizza la posizione corrente del nodo, un vettore casuale e il valore dell'accelerazione relativa al nodo inseguito. 2.2.5 Reference Point Group (RPG) Il Reference Point Group Mobility Model (RPG) definito in [58] rappresenta il movimento casuale di un gruppo di nodi mobili. Gli spostamenti del gruppo si basano sul percorso seguito da quello che è definito il centro logico del gruppo. Il centro logico del gruppo viene utilizzato per calcolare i movimenti del gruppo attraverso un group motion vector, 𝐺 𝑀, che può essere predefinito o scelto in modo casuale. Ogni nodo si muove casualmente seguendo il proprio reference point pre- definito, il cui spostamenti dipendono dal movimento del gruppo. Quando di un nodo viene calcolato un nuovo reference point al tempo 𝑡 + 1, 𝑅𝑃(𝑡 + 1), questo viene combinato con un random vector, 𝑅 𝑀, per rappresentare lo spostamento casuale di ogni nodo rispetto al relativo reference point. Dunque, il vettore 𝑅 𝑀 viene usato per calcolare il nuovo reference point di ogni nodo al tempo t+1. Successivamente la nuova posizione di ogni nodo viene stabilita sommando il random motion vector, 𝑅 𝑀, al nuovo reference point. 43
  • 44. Capitolo 3 Grafi dinamici Nel presente lavoro sono state generate reti dinamiche di contatti (che saranno chiamate da ora in poi Dynamic Contact Network o Contact Graph), ricavate sia da tracce di contatti basate su quello che è avvenuto negli esperimenti SocialDIS e MACRO, sia da tracce di contatti ottenute a partire dai modelli di mobilità. Nei seguenti paragrafi verrà descritto: come si definisce un Contact Graph a partire dai casi reali e dai casi simulati usando modelli di mobilità; gli indicatori statistici definiti ed implementati per poter analizzare e confrontare le Dynamic Contact Network; le limitazioni del formato attualmente più utilizzato per la scrittura di grafi dinamici su file e il nuovo formato che è stato ideato per superarle. 3.1 Definizione del grafo dinamico dei contatti L'evoluzione dinamica di una rete, può essere modellata introducendo la dimensione temporale 𝑡, che mostra come la topologia della rete varia nel tempo. Nelle opportunistic networks, un Contact Graph 𝐺(𝑉, 𝐸) è tipicamente usato per descrivere una rete dinamica di contatti [8]. In un Contact Graph: 𝑉 è l'insieme di nodi ed 𝐸 è l'insieme degli archi, dove ciascun arco è rappresentato da, una coppia di nodi, dal tempo in cui il contatto è iniziato e dalla durata del contatto. Basandosi su questa definizione fornita da Ferreira [8], viene ridefinito il Contact Graph come una rete 𝐺(𝑉, 𝐸), in cui ciascun nodo 𝑣 ∈ 𝑉, rappresenta una persona e ciascun arco 𝑒 ∈ 𝐸, rappresenta un contatto face-to-face avvenuto tra due individui. Sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 l'insieme di tutti gli istanti temporali in cui il grafo varia nel tempo. Ad ogni nodo e ogni arco viene associato un Presence Schedule, un insieme contenente gli istanti di tempo 𝑡 ∈ 𝑇, in cui il nodo (o arco) è presente. Il Presence 44
  • 45. Schedule di un nodo 𝑣 può essere rappresentato come 𝑃(𝑣), e il Presence Schedule di un arco 𝑒 può essere rappresentato come 𝑃(𝑒). A partire da un caso reale (ad esempio gli esperimenti SocialDIS e MACRO), si può facilmente costruire il Contact Graph dalla traccia di contatti collezionata (come viene descritto nei paragrafi 1.2.3 e 1.2.4), generando un nodo ogni volta che un tag RFID viene rilevato per la prima volta da un reader RFID, assegnandogli ciascuna volta il tempo in cui è stato rilevato (in formato UNIX time) e generando un arco ogni volta che due individui si trovano uno di fronte all'altro ad una distanza ravvicinata. Quando questo accade, viene aggiornato il 𝑃(𝑣) di ciascun 𝑣 ∈ 𝑉 che ha partecipato nell'interazione e il 𝑃 𝑒 dell'arco 𝑒 ∈ 𝐸 che li connette. Infatti, il tag RFID indossato dagli individui, quando rileva la comunicazione, invia un messaggio ad alta potenza verso il reader RFID più vicino. Tale mesaggio contiene il tempo in cui il contatto è avvenuto (in formato UNIX time) e l'id dei tag che hanno comunicato. Il peso di ciascun arco del Dynamic Contact Graph ottenuto, è pari alla frequenza con cui il contatto avviene, ossia il rapporto tra 𝑃 𝑒 e 𝑇. A partire dai modelli di mobilità, se si vogliono rilevare i contatti di prossimità tra persone, ciascuna delle quali ha una propria posizione, direzione, velocità e tempo di pausa, bisogna considerare che ogni individuo possa vederne un altro, entro un raggio limitato di visibilità. Un intersection graph [61] è un grafo formato a partire da una famiglia di insiemi 𝑆 𝑖 , con 𝑖 = 0,1,2, … , 𝑛, creando un vertice 𝑣 𝑖 per ogni insieme 𝑆 𝑖 e connettendo due vertici 𝑣 𝑖 e 𝑣 𝑗 con un arco quando i relativi insiemi hanno un'intersezione non nulla, ovvero 𝑒 = 𝑣 𝑖 , 𝑣 𝑗 |𝑆 𝑖 ∩ 𝑆𝑗 ≠ 0. Come è possibile vedere in figura 3.1, uno unit disk graph [62] è un intersection graph costituito da un vertice per ogni cerchio e da un arco ogni volta che due cerchi s'intersecano. Ciascun cerchio, definito nel piano Euclideo, ha la stessa misura. Utilizzando il principio su cui si basa la costruzione dello unit disk graph, viene costruito il Contac Graph come segue: Siano A e B due individui che si muovono secondo un modello di mobilità, sia (𝑥 𝑎, 𝑦 𝑎 ) la posizione di A e (𝑥 𝑏, 𝑦 𝑏 ) la posizione di B. Siano 𝑟 𝑎 e 𝑟 𝑏 i rispettivi raggi dei cerchi di A e B. Definite le seguenti grandezze: 45
  • 46. 𝑥 𝑑𝑖𝑓𝑓 = 𝑥 𝑎, − 𝑥 𝑏, 𝑦 𝑑𝑖𝑓𝑓 = 𝑦 𝑎, − 𝑦 𝑏, 𝐷𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑠𝑞𝑢𝑎𝑟𝑒𝑑 = 𝑥 𝑑𝑖𝑓𝑓 2 + 𝑦 𝑑𝑖𝑓𝑓 2 le persone A e B, che si muovono secondo le regole del modello di mobilità, hanno un contatto se 𝐷𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑠𝑞𝑢𝑎𝑟𝑒𝑑 < 𝑟 𝑎 + 𝑟 𝑏 2 . Fig.3.1: Esempio di unit disk graph, dove tra due nodi esiste un arco che li congiunge, se e solo se i rispettivi cerchi s'intersecano. Se in ogni istante di simulazione applichiamo questa verifica ad ogni coppia di nodi, ogni volta che viene rilevato un contatto, assegniamo al Presence Schedule, di ciascun nodo e dell'arco che li congiunge, il tempo in cui la comunicazione è avvenuta, ottenendo in questo modo un Contact Graph 𝐺(𝑉, 𝐸). Il peso di ciascun arco 𝑒 ∈ 𝐸, è pari alla frequenza con cui il contatto avviene, ovvero il rapporto tra 𝑃 𝑒 e 𝑇 46
  • 47. 3.2 Definizione del grafo aggregato dei contatti I grafi dei contatti possono essere prodotti sia in forma aggregata, che in forma dinamica. Sia 𝐺(𝑉, 𝐸), un Contact Graph e sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli istanti temporali in cui 𝐺 varia nel tempo. Si ottiene un Contact Graph aggregato rispetto un intervallo di tempo 𝑘1 , 𝑘2 , con 0 < 𝑘2 − 𝑘1 = K ≤ 𝑇, assegnado a ciascun arco 𝑒 ∈ 𝐸 un peso pari alla frequenza con cui il contatto avviene, ovvero il rapporto tra 𝑃 𝑒 e 𝐾, senza però associare alcun presence schedule ai nodi/archi del grafo. 3.3 Indicatori statistici/metriche Nei prossimi sotto-paragrafi verranno definiti gli indicatori statistici (o metriche) che sono stati implementati per poter analizzare e confrontare le Dynamic Contact Network ottenute sia, a partire da casi reali che da casi simulati usando i modelli di mobilità. Tali indicatori (o metriche) si classificano in due tipi: metriche su grafo aggregato, ossia indicatori che eseguono misure non considerando i Presence schedules, e metriche su grafo dinamico , ovvero indicatori che effettuano misure considerando i Presence schedules. 3.3.1 Indicatori/metriche su grafo aggregato Node strength. La Strength [1] di un nodo i, definita come: 𝑁 𝑆𝑖 = 𝑤 𝑖,𝑗 𝑗𝜖𝑉 dove V è l'insieme dei vicini del nodo, 𝑉 = 𝑁, 𝑤 𝑖,𝑗 è il peso dell'arco che connette il nodo i al nodo j, misura la "forza" di un nodo in base alla somma dei pesi delle sue connessioni. In un grafo pesato, la strength di un nodo è la somma dei pesi degli archi incidenti al nodo; in-strength e out-strength sono definite per i grafi pesati diretti, similarmente al in- e out-degree. In questo caso la strength è la frequenza attesa, con la quale un nodo comunica con i suoi vicini. Weighted Clustering Coefficient. Il clustering misura quanto i vicini di un nodo tendono ad essere collegati tra di loro, ovvero quanto tendono con esso a formare una clique (grafo completo). 47
  • 48. Il local clustering di un nodo i è misurato con un coefficiente 𝐶 𝑖 , introdotto da Watts e Strogatz per le analisi delle small-world networks [2], definito come rapporto tra il numero attuale di archi tra il nodo i e i propri vicini e il numero massimo di archi che connettono tra do loro i suoi vicini. Pertanto è definita come: 2 𝑒𝑖 𝐶𝑖 = 𝑑𝑣(𝑑𝑣 − 1) Dove dv è il degree del nodo i. Questa misura và calcolata solo per i nodi con 𝑑𝑣 > 1, perché per quelli con 𝑑𝑣 = 1 è pari a 0. Il clustering coefficient del grafo è definito come la media di tutti i local cluster coefficient: 1 𝐶 = 𝐶𝑖 𝑁 𝑖 In figura 3.2 si osserva che, nel caso di weighted graph, il semplice cluster coefficient può sovrastimare la misura del clustering [2],[1], pertanto il local cluster coefficient viene ridefinito come: 2 𝑤 𝑖,𝑗 + 𝑤 𝑖,𝑘 𝐶𝑖 𝑊 = 𝑆 𝑖 (𝑑𝑣 − 1) 2 𝑗 ,𝑘 Dove 𝑆 𝑖 è la Strength del nodo i, 𝑤 𝑖,𝑗 e 𝑤 𝑖,𝑘 sono rispettivamente i pesi degli archi che connetto il nodo i ai suoi vicini j e k che sono tra di loro interconnessi. Fig.3.2: Esempio che mette a confronto il valore del cluster coefficient, calcolato per il nodo 𝑣, con la rispettiva versione pesata. In questo caso particolare, il nodo 𝑣 ha comunicato con una frequenza maggiore, con il nodo 𝑗, dunque anche se 𝑣 fa parte 48
  • 49. di una 4-clique, ne fa meno parte rispetto al caso non pesato. 𝐶 𝑣 = 0.5 risulta essere in questo caso una sovrastima rispetto a 𝐶 𝑣 𝑊 = 0.25. Modularity. Suddividere una rete in partizioni (o cluster) contenenti un elevato numero di archi al loro interno e pochi archi che le connettono l'una all'altra, viene detto Community Detection. La modularity misura la qualità del partizionamento, ovvero quanto bene la struttura di un grafo è stata suddivisa in moduli (chiamati anche gruppi, cluster o community). Grafi con alta modularity hanno connessioni dense tra i nodi appartenenti allo stesso modulo e sparse tra i nodi appartenenti a moduli differenti. La modularity è rappresentata dalla differenza tra il numero di archi contenuti nei cluster di uno specifico partizionamento del grafo e il numero atteso di archi contenuti nei cluster di un grafo random, avente la stessa node degree distribution del grafo per cui viene calcolata tale metrica [23],[24]. In questo modo è possibile stabilire se effettivamente il numero di archi interni ad una community sia maggiore di quanto ci si aspetterebbe da un grafo casuale. Consideriamo un partizionamento 𝑉 = (𝑉1 , 𝑉2 , … , 𝑉 𝑘 ) di un grafo 𝐺(𝑉, 𝐸). La modularity 𝑄 è un punteggio assegnato al clustering definito come: 𝑘 1 𝑑𝑢 𝑑𝑣 𝑄= 𝐴 𝑢,𝑣 − 2𝑚 2𝑚 𝑖=1 𝑢,𝑣∈𝑉 𝑖 Dove 𝑚 = #𝑎𝑟𝑐𝑕𝑖, 𝐴 𝑢,𝑣 = 1 𝑠𝑒 𝑢, 𝑣 ∈ 𝐸 e 0 altrimenti, 𝑑 𝑢 𝑑 𝑣 sono il degree dei 𝑑𝑢 𝑑𝑣 rispettivi nodi 𝑢 e 𝑣, è il numero atteso di archi tra in nodi 𝑢 𝑒 𝑣 nel grafo 2𝑚 random. Questa misura è un valore scalare compreso tra -1 e 1 e nel caso di reti pesate è definita come [25]: 1 𝑘 𝑖 𝑘𝑗 𝑄= 𝐴 𝑖𝑗 − 𝛿 𝐶 𝑖 , 𝐶𝑗 2𝑚 2𝑚 𝑖,𝑗 Dove 𝐴 𝑖𝑗 rappresenta il peso dell'arco tra i nodi 𝑖 e 𝑗, 𝑘 𝑖 = 𝑗 𝐴 𝑖𝑗 è la somma dei pesi degli archi incidenti al vertice 𝑖, 𝐶 𝑖 è la community a cui il vertice 𝑖 viene assegnato, la funzione 𝛿 𝐶 𝑖 , 𝐶𝑗 è uguale a 1 se 𝐶 𝑖 = 𝐶𝑗 (𝑢 𝑒 𝑣 appartengono alla 1 stessa community) e zero altrimenti ed 𝑚 = 2 𝑖,𝑗 𝐴 𝑖𝑗 . 49
  • 50. Calcolare la modularity per grafi di grandi dimensioni, non è un processo banale in termini di tempo di calcolo. In [63] è stato definito il Louvain Method, un algoritmo approssimato che permette di calcolare la metrica su grafi di grandi dimensioni in tempi relativamente rapidi. Ad esempio, impiega solo due minuti per analizzare una rete di due milioni di nodi. In figura 3.3 viene schematizzato il metodo Louvain, costituito da due fasi, ripetute iterativamente. Fig.3.3: vengono mostrate in modo schematico le due fasi del Louvain Method. Si ripetono così i due passi fino a che non si rilevano più cambiamenti a fronte di nuove iterazioni e la massimizzazione della modularity è raggiunta. Nella prima fase ciascun nodo viene associato ad una propria comunità. Per ognuno di essi si verifica se il valore di modularità migliora inserendolo nel gruppo di ciascuno dei suoi vicini. In caso positivo il nodo viene inserito nel cluster del vicino, altrimenti ognuno rimane nel proprio cluster di partenza. Questa operazione viene ripetuta fino a che non è più possibile migliorare il valore della modularity. La seconda fase, aggrega i nodi appartenenti alla stessa community e costruisce una nuova rete, dove i nodi sono le community. Questi due passi vengono ripetuti iterativamente fino a che il valore della modulatiry converge a un valore stazionario, che risulta essere il massimo valore raggiungibile. Density. La densità di un grafo 𝐺(𝑉, 𝐸), che assume valori compresi tra 0 e 1, misura il rapporto tra il numero di archi che esistono nell'insieme 𝐸 e il massimo 50
  • 51. numero possibile di archi che possono esistere tra tutti i nodi 𝑣 ∈ 𝑉. Pertanto la densità viene calcolata nel caso di grafo non diretto (che non può avere cicli) come segue: 2 𝐸 𝑉 ( 𝑉 − 1) Mentre nel caso di grafo diretto, viene calcolata come segue: 𝐸 𝑉 ( 𝑉 − 1) Se il numero di archi di un grafo si avvicina al numero massimo possibile, allora il grafo viene considerato denso, viceversa, se il grafo contiene pochi archi, viene considerato sparso. Un grafo completo ha tutti i possibili archi, dunque ha una densità pari a 1. 3.3.2 Indicatori/metriche su grafo dinamico Flooding time. Il processo di diffusione di un messaggio in un Contact Graph 𝐺(𝑉, 𝐸), è simulato supponendo che, ogni entità che può essere diffusa su una rete di contatti, può essere modellata come un messaggio. Il processo è simulato in uno scenario ideale, dove ciascun nodo ha un'infinita quantità di risorse e il ritardo di trasmissione del messaggio non viene considerato. Sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli istanti temporali in cui il grafo varia nel tempo, viene definito un semplice protocollo di flooding, dove ∀𝑡 𝑖 ∈ 𝑇, con 0 ≤ 𝑖 ≤ 𝑛, un nodo 𝑣 invia il messaggio a tutti i vicini e a loro volta i vicini di 𝑣 inviano il messaggio ai relativi vicini. Al fine di modellare il processo di diffusione di un messaggio, viene definito un messaggio 𝑀 𝑣0,𝑡0 generato da un nodo 𝑣0 (chiamato seed) al tempo 𝑡0 . Il nodo 𝑣0 viene scelto uniformemente fra tutti i nodi 𝑣 ∈ 𝑁 𝑛𝑜𝑡 𝑖𝑠𝑜𝑙𝑎𝑡𝑒𝑑 , dove 𝑁 𝑛𝑜𝑡 𝑖𝑠𝑜𝑙𝑎𝑡𝑒𝑑 , è l'insieme di tutti i nodi della rete non isolati e 𝑡0 è il primo tempo in cui il nodo 𝑣0 appare nella rete dinamica. Viene utilizzando il protocollo di flooding, definito prima, per simulare un processo di diffusione di un'informazione. Eseguendo il protocollo 20 volte, calcolando una media dei risultati ottenuti per ogni simulazione, si può osservare come in media cresce nel tempo il numero di nodi a cui il messaggio è arrivato. Nel Capitolo 5 verrà usata tale osservazione per comparare i tempi diffusione di un 51
  • 52. messaggio, tra le reti ottenute usando i modelli di mobilità e quelle ottenute a partire dalle tracce di contatti reali. Inter-contact time. Si tratta dell'intervallo di tempo che intercorre tra due successivi contatti tra gli stessi nodi. Viene calcolato alla fine di ogni contatto e all'inizio del successivo. Calcolando la Inter contact time distribution si può scoprire quale è la probabilità che un contatto, tra due stessi nodi, si ripeta dopo un determinato numero di secondi. Intra-contact time (o contact duration). Misura l'intervallo di tempo durante il quale due nodi possono comunicare; si tratta quindi del tempo che i nodi possono utilizzare per scambiarsi dati e informazioni. Il numero di questi contatti e la loro distribuzione sono fattori importanti per determinare la capacità di diffusione di un messaggio, perché maggiore è il numero di contatti, maggiore è la probabilità che un messaggio si diffonda in gran parte della rete. Calcolando la Intra contact time distribution si può osservare quale è la probabilità di avere un contatto che duri un determinato numero di secondi. Temporal correlations. La Conditional probability Distribution of link's existence è un indicatore ideato per comprendere se, conoscendo l'esistenza passata di un contatto (rappresentato da un arco del Contact Graph), è possibile avere informazioni riguardo la sua eventuale esistenza futura. Sia 𝐺(𝑉, 𝐸), un Contact Graph e sia 𝑇 = 𝑡0 , 𝑡1 , … , 𝑡 𝑛 , l'insieme di tutti gli istanti temporali in cui 𝐺 varia nel tempo. La probabilità di esistenza di un arco 𝑒 ∈ 𝐸, al tempo 𝑡 𝑖 ∈ 𝑇, con 0 ≤ 𝑖 ≤ 𝑛, è definita come: 𝑃 𝑒 𝑃𝑒 = 𝑃 𝑋 𝑒 𝑡 𝑖 = 1 = 𝑇 dove 𝑃 𝑒 (cardinalità del presence schedule di 𝑒) è il numero di istanti in cui l'arco 𝑒 appare in 𝐺, e 𝑇 è il numero totale d'istanti temporali in cui 𝑒 può apparire. Definite ora le seguenti probabilità condizionate: 𝑃 𝑒,1 = 𝑃 𝑋 𝑒 𝑡 𝑖 = 1|𝑋 𝑒 𝑡 𝑖 − 1 = 1 52