Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne),





télécharger 198.38 Kb.
titreRésumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne),
page3/5
date de publication09.07.2017
taille198.38 Kb.
typeRésumé
d.20-bal.com > littérature > Résumé
1   2   3   4   5


Le graphique 2 propose la distribution taille11/rang des 58 premiers sites les plus visités parmi les 5772. L’analyse graphique confirme les résultats issus des statistiques descriptives : la distribution des visites pour chaque site Internet est très asymétrique.
Graphique 2: Histogramme taille/rang des 58 premiers sites Internet visités


Le graphique montre que le premier site (qui est en réalité le moteur de recherche éducatif Yahoo12) rassemble 1317 visites, alors que le 58ème ne compte plus que 67 visites. Nous avons calculé que l’ensemble de ces 58 premiers sites Internet (soit environ 1% de la totalité des 5772 sites visités) représente pratiquement 40 % des 33100 visites effectuées sur la période d’observation.

Souvent, la distribution de Zipf est présentée comme suit dans la littérature (graphique 3), l’axe des ordonnées laissant parfois place aux occurrences, les ‘bâtons’ du graphique étant d’autre part transformés en points.
Graphique 3: Distribution (Zipf) des 58 premiers sites Internet les plus visités


Nous voyons par exemple sur ce graphique que le site Internet le plus visité représente environ 4 % des 33100 visites effectuées sur 5772 sites différents. Le tableau 4 détaille l’adresse des 10 premiers sites les plus visités par notre échantillon.
Tableau 4 : Occurrences des visites pour les 10 premiers sites

Rang

Part des visites totales

Adresse du site

Thème du site

1

3,98 %

http://akebono.stanford.edu/

Moteur de recherche Yahoo éducatif

2

3,82 %

http://www.yahoo.com/

Moteur de recherche Yahoo

3

3,10 %

http://www.ncsa.uiuc.edu/

Education

4

2,38 %

http://home.mcom.com/

Moteur de recherche

5

1,80 %

http://nearnet.gnn.com/

Moteur de recherche

6

1,47 %

http://info.cern.ch/

Centre de recherche

7

1,45 %

http://sunsite.unc.edu/

Education

8

1,36 %

http://www.mit.edu:8001/

Education

9

1,05 %

http://www.w3.org/

Consortium Internet

10

1,03 %

http://www.timeinc.com/

Site de la Time Warner


Les moteurs de recherche ainsi que les sites éducatifs représentent une part majeure des visites.

Le graphique 4 élargit désormais la distribution taille/rang des visites à la totalité des 5772 sites Internet visionnés une fois ou plus par l’échantillon. La distribution est si extrême qu’elle dessine une parfaite hyperbole rectangulaire.
Graphique 4 : Distribution de Zipf des 5772 premiers sites Internet les plus visités


Pour vérifier l’existence d’une loi de Zipf, la méthode la plus utilisée consiste à effectuer un ajustement linéaire (par les moindres carrés ordinaires) sur la distribution taille/rang, en exprimant chacun des axes sous leur forme logarithmique13. L’expression mathématique de la loi de Zipf devient avec une constante additionnelle qui ne modifie en rien la forme de la distribution. Le graphique 5 présente la loi de Zipf sur une échelle Log-Log. La valeur de la pente estimée est de -0,998. Nous avons donc un rapport inverse presque parfait entre le nombre de visites (la taille) et le rang du site. La distribution semble être proche d’une loi de Zipf de pente -1.
Graphique 5 : Distribution de Zipf des 5772 premiers sites Internet les plus visités

Echelle Log-Log



4.3 La construction de la loi de Pareto et de la loi puissance
A partir des mêmes données de navigation, il est possible de construire d’autres distributions asymétriques (Pitkow, 1998). Parmi ces dernières, la loi puissance et la loi de Pareto (1896) demeurent les plus utilisées dans l’analyse des comportements de navigation. L’encadré détaille la formulation mathématique de ces deux lois.
Une variable aléatoire suit une loi de Pareto lorsqu’elle satisfait l’égalité suivante :

,

est la valeur minimale de (cette loi a d’abord été utilisée pour observer la distribution des revenus dans la population, dès lors correspondait au revenu minimum), avec et , la pente de la loi de Pareto. Nous en déduisons la distribution cumulée :



Dès lors, la dérivée première en de la loi cumulée conduit à la densité de probabilité suivante :

,

La formule précédente correspond à la distribution généralisée de Pareto qui est aussi appelée loi puissance. En d’autres termes, la loi puissance n’est rien d’autre que la fonction de densité de la distribution de Pareto.
La loi de Pareto et la loi puissance étant en réalité identiques, l’estimation d’une d’entres elle suffit. Appliquée à nos données, la loi puissance met en relation le nombre de sites Internet au nombre de visites (graphique 6) tel que :
 ;
avec, une constante, la pente de la loi puissance.

Notons que . Lorsque est proche de 2, on admet que la variable aléatoire suit une loi puissance (Simon, 1955 ; Adamic, 2000 ; Mitzenmacher, 2003). D’autre part, peut être exprimée en termes de fréquences ou d’effectifs, seule la valeur de est modifiée, mais en aucun cas celle de .

Pour construire notre distribution, nous devons compter le nombre de sites Internet qui ont reçu une seule visite, ceux qui ont eu deux visites, et ainsi de suite. Là encore, nous voyons sur le graphique 6 que la relation nombre de sites/nombre de visites est très asymétrique. Par exemple, 3093 sites ont connu une seule visite sur la période d’observation (la fréquence empirique correspond à 54 % environ). Ensuite, 907 sites ont eu deux visites (environ 16 % de la totalité des sites). A l’extrême, un seul site (0,002 % de l’échantillon) a connu 1317 visites.
Graphique 6 : Distribution empirique du nombre de sites en fonction du nombre de visites


Par la suite, l’estimation de la pente peut s’effectuer comme pour la distribution de Zipf ou de Pareto, c'est-à-dire en exprimant la loi puissance sous sa forme logarithmique, afin d’implémenter un ajustement linéaire par les moindres carrés ordinaires :

En suivant la méthode d’estimation de Adamic (2000) (utilisation d’intervalles à amplitude exponentielle pour le nombre de visites) et en respectant la règle de proportionnalité de la surface des bâtons de l’histogramme, nous obtenons une pente pour la loi puissance de -2,07 (pour plus de détails ainsi que l’estimation de la pente de la distribution de Pareto, voir Le Guel, 2004).

In fine, nous vérifions la correspondance des pentes des distributions de Zipf (), de Pareto () et de la loi puissance () tel que :
(Adamic, 2000).
Relativement à nos estimations :

Le calcul des pentes nous permet donc de vérifier un résultat désormais classique de la littérature. Notre échantillon répond à des comportements de navigation ‘dits invariants’, dans le sens où ils peuvent être décrits sous la forme d’une distribution asymétrique.

L’estimation des différentes pentes pour notre échantillon nous permet de vérifier une ‘représentativité’ de notre échantillon relativement aux résultats de la littérature empirique. Notons d’autre part que l’utilisation d’une loi plutôt qu’une autre importe peu, seul le type d’information présenté dans les axes des graphiques change (prise en compte où non du ‘rang’ du site). Une remarque importante doit néanmoins être faite. Les résultats précédents s’intéressent uniquement aux comportements de navigation que l’on pourrait qualifier « d’agrégés ». Dans ce cas de figure, on se concentre avant tout sur les sites Internet en rassemblant les occurrences de visites des sites pour un échantillon d’internautes. Or, cela conduit selon nous à une perte d’informations importante (Bucklin & Sismeiro, 2003), car nous ne mesurons pas réellement les comportements individuels de navigation. A l’extrême, les lois puissances au niveau agrégé ne montrent qu’une fracture numérique du côté de l’offre (c'est-à-dire les sites Internet), où peu de sites reçoivent la majorité des visites. Nous avons là un ‘état’ de la concurrence sur Internet, mais en aucun cas une mesure potentielle de la fracture numérique des usages en ligne au sens d’Hargittai. Rappelons en effet que notre souci est d’étudier la potentialité des données de navigation pour observer une fracture numérique des usages définie comme « la capacité des individus à utiliser Internet de façon effective et efficiente ». Dans ce sens, il nous semble que les variables ‘nombre de visites’ ou ‘nombre de sites’ par individu peuvent être des indicateurs viables pour évaluer cette capacité à utiliser Internet. Ainsi, nous proposons dans la section suivante une analyse des comportements de navigation que l’on qualifie cette fois de désagrégée.
5. Proposition pour une analyse des comportements de navigation au niveau désagrégé : la construction ‘des pentes individuelles’ et leurs conséquences du point de vue de la fracture numérique de second niveau.
5.1 Les pentes individuelles
Seulement quelques travaux placés au niveau des individus ont permis de segmenter les internautes en fonction de leurs comportements de navigation individuel. Cette littérature est souvent issue de l’informatique (Catledge & Pitkow, 1995 ; Cunha, Bestavros, Crovella, 1995 ; Pitkow, 1998). Il existe néanmoins des travaux en gestion (Christ et al., 2001 ; Park & Fader, 2004). L’ensemble de ces études a résulté sur la définition d’un ‘spectre comportemental’ allant du ‘faible’ utilisateur (moins de 10 sites Internet visités par semaine, soit 35 % de l’échantillon chez Christ et al., 2001) à l’utilisateur ‘acharné’ (en moyenne 50 sites visités par semaine, soit 4,3 % de l’échantillon (ibid., 2001)14.

Dans cette section, nous proposons d’utiliser les distributions asymétriques pour caractériser les comportements de navigation de chaque individu de notre échantillon. Nous choisissons alors d’appliquer la loi puissance15 non plus au niveau agrégé, mais désormais au niveau individuel. Il est en effet possible de compter, pour un individu, le nombre de visites sur chaque site à la fin d’une période d’observation considérée. A notre connaissance, une telle démarche n’a pas été proposée dans la littérature en Sciences Economiques. Le graphique 7 présente une distribution puissance pour l’individu ‘numéro 160’ de notre échantillon.
1   2   3   4   5

similaire:

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconChapitre 3 Aménagement Numérique, Attractivité des Territoires et Développement Durable
«Nouvelle Economie», mort-née avec l’éclatement de la «bulle Internet», à l’apparition de la «fracture numérique» puis à sa résorption...

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconNotre constat: le numérique des multinationales contre les peuples
«fracture numérique» est amplifiée par les politiques inadaptées de dématérialisation à courte vue des services publics. Enfin, l’essor...

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconL’association de consommateurs ufc-que choisir dénonce une «fracture...
«fracture sanitaire» dans l’accès aux soins. Les dépassements d’honoraires des médecins sont en cause

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconRésumé Cette étude comparative sur la politique d’accès aux documents...
«Au même titre que les usages d'Internet en font un nouvel outil d'expression, de mobilisation et de dénonciation, est-ce pour autant...

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconAcn gt1 – Identité Numérique
«niveau de garantie élevé», une étude d’impact sur les données personnelles et la vie privée

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconLibre accès et statut juridique de la publication scientifique :...
«pour une République numérique» renforce les positions de la communauté scientifique

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconRésumé Ce livre blanc permet de mieux appréhender les enjeux de l’accessibilité...
«La puissance du Web réside dans son universalité. L’accès par tous quel que soit le handicap en est un aspect essentiel»

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), icon1958 : élection du gdg = établissement d’une nouvelle Constitution : 1
«La France du début des 70’s apparait plus éloignées de celle de 1945 que celle-ci pouvait l’être du 19ème siècle.»

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconI – Où en est la Normandie ?
«très haut débit», de développement des usages et des nouveaux services (notamment dans les services aux citoyens, la Formation,...

Résumé : Dans le prolongement des études relatives à la fracture numérique de ‘premier niveau’ (celle de l’accès à Internet), une récente littérature a pointé sur l’existence d’une fracture numérique de ‘second niveau’ (celle des usages en ligne), iconRÉsumé Nous présentons la théorie, la modélisation et la discussion...
«experimentum crucis» permet de retenir celle décrivant les faits expérimentaux. A noter que des contribution en relation avec ce...






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com