Performance de l'Internet à La Réunion:
Mesures des délais et des routes depuis La Réunion

Réhan NOORDALLY

1 Contexte

L'île de la Réunion est connecté à Internet à travers deux câbles sous-marins que sont le SAFE et le LION II, tel qu'illustré sur la figure 1.


PIC

Figure 1: Connection Internet de La Réunion


La connection Internet est différente de ce que l'on peut trouver sur les continents où le maillage des réseaux (câbles, ...) est important, tel que l'illustre la figure 2. Cette carte représente les différents points d'échange internet répertorié par le site TeleGeography. Un point d'échange est un équipement réseaux permettant à plusieurs opérateurs de s'y connecter et d'échanger les paquets en fonction de la destination.


PIC

Figure 2: Localisation des points d'échange Internet du monde (Source : TeleGeography)


On peut remarquer que dans le zone océan indien, il n'y a la présence que d'un point qu'est REUNIX, le GIX local permettant de garder dans l'île les transmissions internes. Grâce à cet équipement, présent depuis 2004,nous pouvons considérer notre île comme un MAN(Metropole Area Network). Avant cet installation, l'ensemble du trafic réunionnais devait remonter en France avant de redescendre. Grâce à cet équipement, les opérateurs peuvent directement s'échanger des données. La première conséquence est la diminution de la volumétrie de données envoyés sur les câbles sous-marins. La seconde concerne la réduction des délais lorsque l'on veut atteindre des sites hébergés sur l'île. La dernière conséquence est directement lié à l'aspect protocolaire des réseaux avec une meilleure QoS 1 .

2 Objectifs

Deux sondages récents, le premier réalisé par Médiamétrie en novembre 2015, et le second réalisé au mois de Janvier 2016 par We are social, ont montré des résultats similaires à savoir que de 44% à 55% de la population réunionnaise est connectée à Internet [1]. Une autre étude réalisée par la société BinarySec en 2013, s'intéresse à la qualité de la connectivité de l'Internet [2]. Dans cette étude, l'auteur présente un classement des opérateurs à travers 9 mesures différentes. On y remarque que certaines caractéristiques sont meilleures qu'en France, tel que la moyenne du débit descendant. En France, d'après Akamai 2 , le débit français moyen en 2015 est de 8,2 Mbps. À la Réunion nous avons calculé un moyenne de 9,36Mbps en 2013. Cette différence s'explique par la grandeur du territoire métropolitain et des zones reculées où l'accès internet est restreint. Une meilleure vitesse ne garantis pas une meilleure connectivité et de temps de réponse plus court.

Ces 2 sondages  [1] et le rapport  [2] montrent l'importance pris par l'Internet pour une population insulaire et la performance de la connectivité Internet.

La question qui n'a pas été répondue dans l'étude qualitative est : pourquoi le temps de réponse est si long ? C'est pour répondre à cette question que nous proposons une campagne de mesures portant sur les temps de transfert des paquets.

L'objectif de cette étude consiste à partir de mesures faites au niveau des accès résidentiels d'inférer la composition des délais. Au travers de ces mesures, la connectivité Internet de La Réunion pourra être caractérisée. C'est à partir de cette connaissance, que des pistes d'améliorations pourront être avancées.

3 Methodologie

En métrologie on distingue classiquement 2 méthodes pour l'obtention des mesures. La première méthode consiste en l'injection de paquets dans le réseau et les données relatives à ces paquets servent de mesures. On appelle cela la métrologie active. On parle de métrologie passive, lorsque l'on fait des captures de trafic et une analyse à posteriori. Ces 2 méthodes sont complémentaires et ensemble elle à renforces la validité des analyses effectuées.

Nous proposons de mettre en place une étude de métrologie active sur les différentes connectivité de l'Internet sur tout l'ile. Par soucis de représentativité et de validité, les mesures ne peuvent être faites uniquement depuis le laboratoire à l'université. Aussi votre concours est nécessaire pour la réalisation de cette étude au travers de l'hébergement chez vous d'une sonde de mesure de votre connectivité Internet. La sonde de mesure prend la forme d'un nano ordinateur linux connu sous le nom de raspberry pi  [3]. Afin d'avoir une représentativité convenable, la période de mesures durera 1 mois consécutif et simultanément pour toutes les sondes. Les dates des mesures sont du 1er Avril au 1er Mai de cette année.

Les sondes effectuent les mesures et constituent une archive des données collectées par jour. Les sondes sont contrôlées à distance pour notamment remonter les résultats. Les mesures sont faites en utilisant l'application traceroute. En fait, l'application est Paris-traceroute [4]. Cette version de traceroute donne une meilleure description des routes en évitant que les mesures soient perturbées par l'équilibrage de charge (load balancing) des routeurs traversés.

Cette étude de métrologie se compose de plusieurs phases :

1 Choix des destinations

Les adresses IP de destination sont des adresses IPv4 publiques. Dans un ensemble de 1000000 d'adresses tirés aléatoirement, nous avons retenu un sous-ensemble de 84000 adresses qui répondaient aux requêtes ICMP. Nous avons choisis de géolocalisé ce sous-ensemble. Le résultat obtenu est illustrée par la figure 3. De ce sous-ensemble nous avons sélectionné 10000 adresses IP pour constituer notre jeu de destinations. Le choix des 10000 adresses a été fait pour respecter la répartition géographique des noeuds dans l'Internet que nous avons obtenus précédemment. La géocalisation des adresses IP n'est pas représentative du nombres d'internautes connectées, tel que peux le montrer la figure 4.


PIC

Figure 3: Repartition géographique des adresses IP sélectionnées
PIC
Figure 4: Repartition géographique des utilisateur Internet en Novembre 2015 Source : Internet World Stats


2 Protocole de mesure

Cette partie se concentre sur les sondes. Dès qu'une sonde est alimentée électriquement, elle va commencer automatiquement à réaliser les mesures afin de tester la validité de la connectivité. Une journée de mesure consiste à tester la connectivité avec les 10000 adresses IP du jeu de destination. Chaque destination n'est contacté qu'une seul fois par journée de mesure.

Dans le détail, cet ensemble de 10000 adresses IPv4 sera copié dans un fichier temporaire. La sélection de l'adresse IP se fera aléatoirement en tirant une adresse au hasard et en la supprimant par la suite. Ce nouveau fichier sera traité par la commande suivante :


Listing 1: Commande de mesure
    paristraceroute m 255 p icmp ip

les options correspondennt à la liste suivante :

Afin d'insérer un peu de hasard supplémentaire dans notre étude, nous avons mis un temporisateur entre deux mesures d'un même fichier. La valeur maximal du temporisateur se base sur le calcul suivant :

Valeur = (nombre_de_secondes_par_jour ∕nombre_ip)− Moyenne_duree_traceroute
(1)

Valeur = (86,400∕2,500)− 28
(2)

La valeur obtenue par la formule nous donne un écart maximal de 6.56 secondes.

3 Collecte des résultats

La phase 3 consiste uniquement à une boucle infinie de la phase 2 jusqu'à la fin de l'étude. Lorsque les 10,000 adresses IPv4 seront traitées 3 , la sonde compactera l'ensemble des fichiers résultats dans une archive. Cette archive sera envoyés sur un serveur de données et supprimé de la mémoire du raspberry pi. La sauvegarde distante des données permet la finalisation de la phase 2 de la méthodologie.

4 Analyse des mesures

Après le mois de mesures écoulé, l'ensemble des archives téléchargées des sondes seront analysées. L'analyse cherchera à évaluer par technologie d'accès et par opérateur (FAI) :

L'analyse s'appuiera sur une géolocalisation des adresses IP que les sondes aurons rencontrés. Lors de ce traitement, nous veillerons à obtenir le pays de l'adreses IP, les coordonnées géographiques et les informations d'AS(Autonomous System). Ces informations vont servir à comparer les résultats obtenus à des résultats théoriques. Par exemple, avec les coordonnées géographiques, nous allons pouvoir réaliser une estimation du délai, tel que l'a démontré Krajsa [5] dans son article sur le RTT et sa dépendance à la distance géographique. Ce calcul nous permettra également de prouver, dans certains cas, du non-respect de l'inégalité triangulaire [6]. La violation de l”inégalité triangulaire dans Internet a été maintes fois prouvé. Que ça soit dans la zone avec les règles de routage Africaines  [7], [8] ou dans des pays où Internet est monnaie courante comme le Canada [9]. Les informations sur les AS vont nous permettre de vérifier les différents changement de routes durant les mesures. On va vérifier si les changements on eu lieu à l'intérieur de l'AS ou non. Dans le premier cas, les changements n'ont pas de réels impacts. Dans le second, les routes empruntées peuvent être plus longues et les délais impactés. Pour mesurer les changements de route, nous allons nous basés sur les travaux de Chan  [10] et utilisé l'indice de Jaccard.

4 Conclusion

La mesure des délais sur Internet et des routes sont des éléments importants dans la performance du service de connectivité. Les mesures proposées visent à caractériser les paramètres des délais et les caractéristiques des routes Internet depuis la Réunion.
Afin d'avoir des résultats représentatifs, il est nécessaire d'avoir une diversité dans la connectivité au sens des opérateurs tout en ayant un nombre important de points de collecte de données réparties sur le territoire. C'est pour cela que votre participation est importante. En acceptant d'héberger une sonde pour une période d'un mois de mesure, vous pourrez ainsi (i) avoir un audit de votre connectivité Internet (ii) recevoir un Raspberry Pi (sous condition que la connectivité à été maintenue pendant la période de mesures) à l'issu de la phase de collecte des mesures.

Comme pour chaque appareil connecté à votre connexion Internet, il va consommé votre bande passante. Pour chaque sonde branchée, il existe un impact pour la connectivité Internet à laquelle il est raccordée. Cet impact est calculé par la formule suivante :

Charge = taille_du_paquet ∕RT T_moyen_general
(3)

Charge = 64∕(375.028∗ 10^−3) = 64∕0.375028 = 682,62170,65bit.s^−1
(4)

La charge calculée est négligeable devant les capacités que propose les différentes connexions actuelles. D'après l'étude de métrologie réalisé par BinarySec  [2], le débit montant le plus faible est de 128.33Kb/s. Ce débit mesuré est plus de 150 fois supérieur à la charge utilisée par notre sonde. La connexion de l'hébergeur ne sera donc pas impacté par notre étude.

Afin de nous assurer que les sondes soient correctement configurer, nous imposons quelques contraintes. La première concerne le branchement de la sonde. En effet, nous souhaitons que nos sondes soient branchées et connectées quelques jours avant afin de pouvoir valider l'accès distant et les derniers tests. La seconde condition est que la sonde doit rester branchée quelques jours après la fin de l'expérience afin de récupérer les derniers résultats. La troisième condition est que vous soyez joignables, à minima par courriel, pour réaliser un entretien de la sonde. L'entretien de la sonde consistera principalement à la rebrancher électriquement en cas de coupure de courant.

Pour participer à notre enquête, rien de plus simple. Il suffit de remplir le questionnaire suivant : http://goo.gl/forms/0fyMpdnqu3
Des conditions d'hébergement de la sonde sont imposées. Elles concernent le FAI et la ville de résidence du sondé. Une fois le questionnaire rempli,et nous vous remercions d'avance pour cela, nous vérifierons que les conditions que nous nous imposons soient respectées. Si tel est le cas, nous prendrons contact avec vous et vous remettrons un kit complet comprenant :

Pour rappel, à l'issue de la phase de collecte des mesures, ce kit (d'une valeur de 40) vous sera offert, sous condition que la connectivité à été maintenue pendant la période de mesures.

Bibliographie

  1. 44% d'utilisateurs d'internet à la réunion, autant qu'à Mayotte," 2016. [Online] Available : http://www.clicanoo.re/509172-44-d-utilisateurs-d-internet-a-la-reunion-autant-qu-a-mayotte.html
  2. M. Vergoz, "Classement des opérateurs Internet Réunionnais," BinarySec, Tech. Rep., 2013
  3. "Raspberry pi, official website." [Online]; Available : http://www.raspberrypi.org/
  4. B. Augustin, X. Cuvellier, B. Orgogozo, F. Viger, T. Friedman, M. Latapy, C. Magnien, and R. Teixeira, "Avoiding traceroute anomalies with paris traceroute," in Proceedings of the 6th ACM SIGCOMM conference on Internet measurement. ACM, 2006, pp. 153-158.
  5. O. Krajsa and L. Fojtova, "Rtt measurement and its dependence on the real geographical distance," in Telecommunications and Signal Processing (TSP), 2011 34th International Conference on. IEEE, 2011, pp. 231-234.
  6. C. Lumezanu, R. Baden, N. Spring, and B. Bhattacharjee, "Triangle inequality and routing policy violations in the internet," in Passive and Active Network Measurement. Springer, 2009, pp. 45-54.
  7. A. Gupta, M. Calder, N. Feamster, M. Chetty, E. Calandro, and E. Katz-Bassett, "Peering at the internet’s frontier : A first look at isp interconnectivity in africa," in Passive and Active Measurement. Springer, 2014, pp. 204-213.
  8. R. Fanou, P. Francois, and E. Aben, "On the diversity of interdomain routing in africa," in Passive and Active Measurement. Springer, 2015, pp. 41-54.
  9. J. A. Obar and A. Clement, "Internet surveillance and boomerang routing : A call for canadian network sovereignty," in TEM 2013 : Proceedings of the Technology & Emerging Media Track-Annual Conference of the Canadian Communication Association (Victoria), 2012.
  10. E. W. Chan, X. Luo, W. W. Fok, W. Li, and R. K. Chang, "Non-cooperative diagnosis of submarine cable faults," in Passive and Active Measurement. Springer, 2011, pp. 224-234.