Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

retour

Audience et capacité

Audience et capacité

Chiffres clés

Lorsque l’on parle de capacité d’accueil, il faut souvent manipuler des notions qui s’entremêlent. Marketing, webmestres et architectes ne parlent pas le même langage. Voyons rapidement comment construire des équivalences.

Visites par mois

Vmois

Une visite est une session, une suite de requêtes plus ou moins enchaînées. On parle aussi de visiteurs uniques, mais cela n’a pas d’intérêt au plan technique. Un même visiteur (unique) peut effectuer plusieurs visites dans le mois.

Pages par visite

P

Le nombre de pages parcourues lors d’une visite. On parle d’une moyenne sur l’ensemble du trafic, bien sûr. Il se situe typiquement entre 5 et 15 pages par visite. C’est une grandeur qui est en général assez stable, pour un site donné

Délai moyen entre deux pages

D

Le délai moyen entre deux requêtes de pages. Il peut être typiquement de l’ordre de 15-30 secondes, mais dépend fortement bien sûr de la quantité d’information de la page, et plus encore des phases de saisies.

Heure de pointe

Le trafic n’est pas régulier, il y a des jours de pointe, et au sein d’une journée typique, il y a des heures de pointe. Pour le dimensionnement d’une plateforme, c’est uniquement l’heure de pointe qui importe.

On considère parfois que le jour de pointe représente 1/20ème du trafic du mois, soit Vjour= Vmois/20. Et de même, on peut estimer que l’heure de pointe concentre 1/5ème du trafic de la journée, Vheure= Vjour/5. Et au total donc Vheure=Vmois/100.

En fait ces ratios dépendent fortement de la typologie de l’application, de sa cible, grand public ou professionnelle. Le site d’une émission de télévision, ou d’événements sportifs, pourront avoir un trafic bien plus concentré encore. Mais du moins en l’absence de plus d’information, on peut utiliser ces ratios.

Pour la plateforme, la notion de visite n’est pas la plus importante. Sur un site de publication, on s’intéressera plutôt au nombre de pages servies.

Si à l’heure de pointe, on reçoit Vheure visites, cela correspond à P.Vheure pages servies, que l’on peut ramener à la seconde : W = P.Vheure/3600 pages servies par seconde. Pour fixer les idées, un serveur sert typiquement entre 10 et 1000 pages par seconde. Oui, l’écart est très grand, mais c’est un fait : la capacité unitaire dépend de l’optimisation, du langage et de nombreux paramètres internes.

Application numérique : 100 000 visites par mois, 10 pages par visite, on obtient W = 2,77 pages par seconde à l’heure de pointe, ce qui devrait être supporté sans difficulté par un serveur unique.

Nous sommes passés des visites aux pages de manière un peu rapide. En fait, tout dépend ici encore de la typologie du service. Si une visite type se compose d’une page de recherche, de trois pages de saisie et de 5 pages de consultation, alors c’est ce scénario qui importe. Et l’on calculera plutôt le nombre de recherches par seconde, le nombre de saisies par seconde et le nombre de consultations par seconde, avec des impacts très différents sur la base de données par exemple.

Notons que dans ces calculs, le délai moyen entre deux requêtes n’a pas été utilisé. En effet, il n’intervient pas à ce niveau : si les internautes naviguent plus rapidement, ils sollicitent davantage le serveur, mais pendant moins longtemps.

Connexions simultanées

On entend parfois raisonner en termes de connexions simultanées. C’est une notion qui n’est pas la plus appropriée pour le web, mais qui peut avoir un sens, par exemple s’il y a des ressources mobilisées pour la durée d’une visite, d’une session. Chaque visite a une durée égale à D.P, délai moyen entre pages multiplié par nombre de pages par visite.

A l’heure de pointe, on a donc Vh.D.P « secondes de visite », sur 3600 secondes, donc un nombre moyen de sessions simultanées égal à S = V.D.P/3600, c’est à dire aussi S = W.D.

Application numérique : dans le cas précédent, et pour un délai moyen de 30 secondes, on trouve S = 2,77 x 30 = 83 sessions simultanées.

Temps de réponse

Lorsque l’on parle de temps de réponse observés, il faut toujours préciser « à XX% », typiquement à 90 ou 95%.

En effet, lorsqu’un grand nombre d’internautes soumettent des requêtes, de manière totalement indépendante, il est possible que 10 d’entre eux cliquent sur un lien dans un même petit intervalle de temps, disons 1/100ème de seconde. S’il y a peu de trafic au total, alors la probabilité de cette coïncidence est faible, mais toujours non nulle. Et si cela se produit, alors au moins une partie de ces 10 requêtes sera servie plus lentement.

Sans entrer ici dans des calculs de probabilité poussés, on voit bien qu’on ne peut jamais garantir un temps de réponse à 100%, car il peut toujours y avoir des coïncidence rares de trafic qui dégradent exceptionnellement le temps de réponse.

Si l’on conduit un test de forte charge, que l’on relève chacun des temps de réponse observés, et que l’on range ces temps de réponse du plus court au plus élevé, alors on obtient en général une courbe qui a sensiblement la forme suivante :

image009

Où l’on voit que les courbes tendent vers une asymptote verticale vers la droite, correspondant aux conjonctions extrêmes. Ces cas extrêmes ne sont pas les plus intéressant, ce qui évalue le mieux la qualité de service est le temps de réponse à 90%, ou encore à 95%.