Indicateurs statistiques de fraude électorale

404 vues

Publié le

Présentation à la Commission Electorale du Canton de Genève

Loi de Benford
Modèle binomial robuste surdispersé
Autre indicateur
Propositions

Publié dans : Données & analyses
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
404
Sur SlideShare
0
Issues des intégrations
0
Intégrations
14
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Indicateurs statistiques de fraude électorale

  1. 1. Indicateurs statistiques de fraude électorale Ph. Guglielmetti, CEC, 10 mai 2015
  2. 2. Indicateurs statistiques de fraude électorale 1. Loi de Benford 2. Modèle binomial robuste surdispersé 3. Autre indicateur 4. Propositions
  3. 3. 1. Loi de Benford ● Surprenant : en mesurant de nombreuses choses dans la nature, les nombres commencent plus souvent par 1 que par 2 etc. jusqu’à 9 ● Exemples : population des pays ou longueur des fleuves ● C’est vrai aussi pour le deuxième digit
  4. 4. Test statistique “Loi de Benford” ● Pour la détection de fraude on utilise le 2ème digit, car trop de locaux ont ~ 1000 votants ● le “ test du χ² ” vérifie si le deuxième chiffre du nombre de oui / non des locaux de vote obéit à la loi de Benford ● si le résultat est < 16.92 on est sur à 95% que oui
  5. 5. Critique du test de Benford Si le résultat est > 16.92 on ne sait pas grand chose car: 1. ça arrive “normalement” dans 5% des cas 2. on ne sait pas quel(s) bureau(x) de vote sont concernés La validité du test est fortement contestée dans la littérature lorsqu’il y a peu de bureaux de taille trop similaire Seule cas de fraude que ce test est vraiment capable de détecter: Si quelqu’un génère les résultats à l’aide de la fonction RAND() d’Excel au lieu d’utiliser POWER(10;RAND()) / 10 Ah zut je l’ai dit… Donc ce test est désormais inutile.
  6. 6. 2. Modèle binomial robuste surdispersé 1. On a comparé les votes OUI / NON (binomial) des communes pendant 10 ans 2. On a construit un “modèle robuste” de ces relations selon deux “variables indépendantes” vote comme A B C D A 100% 80% 12% 3% B 80% 100% 36% 22% C 12% 36% 100% 42% D 3% 22% 42% 100% A B C D
  7. 7. ( Politique à 2 dimensions ) 1. Représentation de plus en plus courante en analyse politique 2. http://smartvote.ch/ 3. “Wie sich die SVP aus dem Bürgerblock verabschiedet hat” Tages Anzeiger, 21. April 2014 http://sotomo.ch/
  8. 8. Modèle binomial robuste surdispersé 3. Le modèle permet de prévoir les résultats dans une commune d’après les résultats dans les autres (surdispersion): A B C D OUI 48% ? 80% 52% A B C D Oui
  9. 9. Modèle binomial robuste surdispersé 4. Les poids mesurent la correspondance avec la tendance générale. 5. Les résidus sont les écarts entre le résultat réel et celui prévu par le modèle.
  10. 10. Critique du MBRS 1. “Effectivement, les modèles avec surdispersion sont une très bonne idée !!” (Arthur Charpentier, prof de stats Montréal http://freakonometrics. hypotheses.org/12142 2. “Lorsque l'objet concerne des questions d'ordre géographique, les profils ne seront peut-être pas suffisants pour expliquer les résultats.” 3. Le modèle a été établi sur 10 années (199x-200x) Comment le remettre à jour ? Faut-il le faire en permanence ?
  11. 11. Autre indicateur de détection de fraude ● Klimek & all (2012). It’s not the voting that’s democracy, it’s the counting: Statistical detection of systematic election irregularities 10.1073/pnas.1210722109 ● La participation est une donnée disponible et importante
  12. 12. Propositions 1. Représenter les résultats du MBRS en couleur sur une carte du Canton 2. Ajouter les graphiques résultat / participation 3. (Supprimer Benford) 4. Etudier comment “resetter” ou faire évoluer le MBRS

×