Le Web Mining a-t-il révolutionné le E-commerce?

SimShaka · 17 Mars 2005

Bonjour à tous,

Je suis tombé par le biais d'un moteur de recherche sur votre forum.

Je dois actuellement réaliser une étude intitulée "Le Web Mining a-t-il révolutionné le E-commerce ?"

Un manager de SAS m'a lui dit que la réponse était oui seulement pour les sites qui possèdent des millions de données comme Amazon mais pas pour les plus petits.

J'ai pas mal de trucs sur le E-commerce ou sur le Web et Data Mining mais pas sur les deux laugh.gif

Je voulais savoir aussi si vous pouviez me donner votre avis sur la question et si vous aviez des liens avec des infos qui pourraient m'aider?

J'avoue que je suis un peu perdu sur la question.

Merci d'avance pour votre aide.

Modifié 17 Mars 2005 par SimShaka

**ams51** · 17 Mars 2005

Bonjour,

on peut avoir une definition du web mining

merci

SimShaka · 17 Mars 2005

Le Web Mining s'est développé à la fin des années 90. Ce domaine consiste à utiliser l'ensemble des techniques du Data Mining afin de développer des approches et des outils, permettant d'extraire des informations pertinentes à partir de données du web (documents, traces d'interactions, structure des pages , des liens...).

Les principales sources d'informations sont les fichiers logs du serveur, les bases de données clients, les cookies, ... qui permettent d'alimenter des data webhouses.

Le Web Mining se scinde en trois approches, le Web Structure Mining, le Web Content Mining et le Web Usage Mining. La première consiste en l'analyse structurelle du web, la seconde à l'étude du contenu des pages et enfin la troisième aux comportements de navigation des internautes.

Différentes méthodes statistiques sont utilisées dans le développement d'applications de Web Mining :

* Techniques d'association : filtrage collaboratif, cross selling, ... qui permettent de déterminer les comportements a priori d'un utilisateur par rapprochement avec ceux d'autres utilisateurs.

* Segmentation : recherche de groupes homogènes dans le cadre d'anticipation de besoins et dans un souci de communication adaptée à chaque segment d'utilisateurs.

* Classification : relier les caractéristiques socio-démographiques d'un client à son comportement. Utilisation des arbres de décision, des réseaux de neurones,...

* Estimation : Régression, ...

Les enjeux du Web Mining sont de 3 ordres :

* Amélioration des performances et du confort du site.

* Augmentation du rendement des espaces publicitaires

* Amélioration de la rentabilité de chaque visiteur par amélioration de la personnalisation.

En dehors d'offrir la possibilité aux administrateurs de site de connaître la performance de leur site, le web mining permet essentiellement aux sites de ventes en ligne de connaître les comportements d'achats de leurs clients. Il offre la possibilité d'exploiter la personnalisation des clients (utilisation des profils utilisateurs), le filtrage collaboratif, ... dans le cadre de stratégies de marketing 1-to-1.

Voilà tout ça vient d'ici:

http://www.web-datamining.net/forum/faq_wm.asp

**ams51** · 17 Mars 2005

merci...

c'est pas simple à comprendre en première approche je vais essayer de voir ça à temps perdu

**Cariboo** · 17 Mars 2005

Bref, on peut simplifier tout cela en disant que le data mining consiste à savoir "extraire" des données utiles dans un monceau de données inutiles ou inexploitées...

Bref, dans le data mining, il y'a les techniques d'extraction d'infos, qui sont de l'informatique pure, avec des algos particuliers, et beaucoup de statistiques.

Anonymus · 17 Mars 2005

Ce qui me chagrine, dans ton titre, c'est l'utilisation du 'passé'.

je pense que l'avenir a encore de beaux jours devant lui , et que le WebMining n'en est qu'à ses balbutiemments.

C'est dommage, j'avais un article du directeur de Carrefour (Grands magasins), qui expliquait qu'ils traitaient chaque jours quelques milliards (?) de données, sur leurs clients, et qu'ils étaient à meme de réagir très rapidement à des changements de comportements, à des effets de mode, etc.. C'etait pas du 'Web', mais du commerce tout de meme

Pour ce qui est de l'Ecommerce, en France, comme dans beaucoup de régions, d'ailleurs, les habitudes des consommateurs ne sont pas encore fixes, d'ailleurs les futurs consommateurs du web n'ont pas forcément encore un micro chez eux. C'est pourquoi je trouve cela prématuré d'utiliser le passé (j'me répète ?)

Enfin, voilà..

guilcorp · 17 Mars 2005

Moi je comprend qu'il ait utilisé le passé car la révolution est faite.

Les e-commerce qui n'utilise pas de "tracking proactif" n'ont aucune chance et déjà depuis quelque année.

C'est un avis extérieur, car je ne suis pas un spécialiste, mais quand on voit les capacités d'analyses et la pertinance des gros vendeurs Amazon, shoes.com... c'est la que l'on voit que c'est une usine à gaz :wacko:

Le WebMining à changer la donne car il permet une optimisation de l'offre à l'échelle mondial. Les sites qui utilisent ça sont devenu les premiers supermarchés mondiaux.

Quand on prend l'exemple de shoes.com :

Tu choisis tes chaussures par catégories, par couleur, par style, par prix... et puis il te propose d'autre modèle grâce au profilling actif. C'est tellement "confortable" et "easy".

Ca fait froid dans le dos :unsure:

Comment organiser une concurrence, surquel arguement se positionner quand on a pas le budget d'Amazon?

SimShaka · 17 Mars 2005

Le WebMining à changer la donne car il permet une optimisation de l'offre à l'échelle mondial. Les sites qui utilisent ça sont devenu les premiers supermarchés mondiaux.

Tu pourrais développer un peu plus?

Si le web mining n'avait pas existé pourquoi n'aurait-on pas pu adapter l'offre à l'échelle mondiale.

Pour la question elle m'a été imposée telle quelle. Je traiter cette question là.

Moi j'aurais tendance à dire il a révolutionné mais partiellement et il continue à le faire mais c'est quand même chaud pour développer je trouve. :blush:

Anonymus · 17 Mars 2005

Quand on prend l'exemple de shoes.com :
Tu choisis tes chaussures par catégories, par couleur, par style, par prix... et puis il te propose d'autre modèle grâce au profilling actif. C'est tellement "confortable" et "easy".

Ca fait froid dans le dos

Ce n'est pas le WebMining.

En fait, il s'agirait plutot de dire :

Tel internaute achete tel produit, donc on va lui proposer tel autre produit, car en général les internautes qui achetent le premier produit ont besoin du second.

Un exemple : L'internaute achete une voiture télécommandée, on lui propose des piles pour aller avec. L'internaute achete un ordinateur, on lui propose un tapis, parce qu'en général, ils achetent ca, avec.

Ces exemples sont assez simples, mais sur 'une tonne' de marchandises, il faut des statistiques fiables, et pas des 'inspirations sommaires'. Autrement dit, il faut étudier les gouts et couleurs de chacun, ainsi que ses spécificités.

Un internaute a un 'grand' age, donc il sera plutot intéressé par une grosse berline.

Un internaute est assez 'jeune, alors ce sera plutot une petite sportive.

Il a une famille ? alors ce sera un 'espace', etc...

Poussé sur le web, le meme principe s'applique. On teste la bannière à gauche, puis à droite du site, et on regarde les stats. On compare les résultats des ventes aux US et en France, et on adapte le site aux clients, à leur géolocalisation, etc..

Je persiste, on n'a que les balbutiemments, pour la simple et bonne raison que tout le monde n'a pas encore internet. De plus, les puissances de calcul, nécessaires pour ce genre de stats, etant assez... grandes, l'avenir nous réserve encore pas mal de surprises à ce niveau.

Mais de la meme facon qu'il ne sert à rien d'envoyer de la poudre de lait dans un pays où il n'y a pas d'eau, il faut étudier les habitudes d'achat des internautes, pour réaliser des économies à 'petite/grande' échelle... mais des économies indispensables..

Nico.

**Magicoyo** · 17 Mars 2005

Le Web Mining, c'est l'industrialisation des services appliquée au web.

En gros, on industrialise le BAM (Bonjour, au revoir et merci), l'orientation du client dans la gamme, le conseil sur les produits, la (re)connaissance des besoins du client, l'accompagnement, le bouche à oreille...

En revanche, c'est évident que c'est pas à la portée de tous le monde. Associer "à la main" des produits d'un catalogue en fonction de son expérience est simple à réaliser.

Le one-to-one (on considère chaque client comme un segment de marché) systématique et automatique requiert des ressources énormes. Seuls les très gros comme Amazon peuvent se le permettre.

De là, si la question est : Amazon and Co ont-ils révolutionné le e-commerce. Je dirais bien sur !

Ils ont poussé la logique du marketing de la demande jusqu'au bout, en exploitant à fond les capacités de traitement de l'outil informatique.

La redoute avec son catalogue et son bon de commande papier fais figure d'artisan quand à la connaissance de ces clients.

Et pour terminer, ils ont montré que ces investissements là pouvaient être rentables, si on est bon commerçant.

**Cariboo** · 17 Mars 2005

Je suis d'accord avec Nico (Anonymus) pour dire que ces techniques représentent plutôt l'avenir, car peu de sites les utilisent aujourd'hui...

Il faut dire que cela nécessite la mobilisation de ressources assez rarement toutes présentes dans la plupart des services internet de boîte :

- de bons statisticiens (ou en cas tout des gens qui savent ce que c'est qu'un Khi2)

- de bons spécialistes des bases de données (en tout cas des gens qui savent ce que c'est qu'un MCD et un "data warehouse")

- de bons informaticiens (qui savent programmer des agents de "mining")

- et des connaissances en algorithmique avancée

Bref, ça ne se trouve pas partout...

On peut passer par des sociétés ou des consultants spécialisés, mais ça coûte assez cher...

Ceci dit, pour ceux qui le peuvent, je recommande de travailler dans cette direction, car comme certains l'ont souligné, cela donne un avantage concurrentiel intéressant...

Nicolas, pour la puissance de calcul, on a pas besoin d'un Cray... La plupart des calculs peuvent se faire "oflline".

Par ailleurs, les techniques de data mining fonctionnent aussi pour des bases plus modestes que celle d'Amazon (qui lui est confronté à des problèmes de scaling délicats à résoudre). A partir d'une certaine taille de bases clients, ou de bases de membres, on arrive à faire des calculs statistiquement pertinents.

SimShaka · 17 Mars 2005

Le conseiller SAS que j'avais interviewé m'a dit qu'une société d'Assurance Française bien connue avait fair appel à un outil de Data mining pour son site mais que ça ne s'était pas averé rentable et que depuis ils ne veulent plus en entendre parler. Je suppose donc que dans certains cas le E-commerce n'est d'aucune nécessité.

En tout cas merci déjà pour votre contribution

SimShaka · 25 Mars 2005

Rebonjour, j'ai encore besoin de votre savoir.

Le pc banking concerne des transactions qui se font sur le net et par conséquent il s'agit de E-commerce. Mais je ne pense pas que le data mining ait une nécessité quelconque

dans ce milieu de la banque et de l'assurance en ligne. Est-ce que je me trompe ou est-ce que le mining n'a pas du tout boulversé ce milieu là?

autre chose, le fait que sur certains sites comme amazon lorsqu'on clique sur un livre il va nous proposer d'autres livres ou bien nous proposer un réduction si on achète celui-là plus un autre qui traite du même sujet.

Sur le site de Fnac quand on va sur un cd, on peut voir "les personnes ayant acheté ce cd ont aussi acheté ceux-cis..." avec une liste de cd qui apparait en bas de la page.

Est-ce deux types de choses ont été apportées par le data/web mining ou bien ça n'a rien à voir avec le mining? ou bien ça dépend de la taille des sites. Anonymus avait l'air de dire que ça n'était pas du web mining :S

Ques sont les problèmes de scaling d'amazon dont tu parles cariboo?

Merci d'avance pour votre aide

**lafleur** · 25 Mars 2005

Il faut dire que cela nécessite la mobilisation de ressources assez rarement toutes présentes dans la plupart des services internet de boîte :
- de bons statisticiens (ou en cas tout des gens qui savent ce que c'est qu'un Khi2)

- de bons spécialistes des bases de données (en tout cas des gens qui savent ce que c'est qu'un MCD et un "data warehouse")

- de bons informaticiens (qui savent programmer des agents de "mining")

- et des connaissances en algorithmique avancée

Et quelqu'un qui touche sa bille en matière de back-office, non ? La gestion des stocks, ça s'improvise pas.

Je crois qu'en ce domaine précisément, peu de choses sont inventées sur le web. Il s'agit plus d'adapter des solutions qui font leur preuves ailleurs, en grande distrib' par exemple, ou bien en VPC. Bien souvent, on réinvente l'eau chaude pour résoudre des problèmes qui connaissent déjà des solutions efficaces à La Redoute ou chez Auchan depuis des années.

Proposer un autre produit à un acheteur parce qu'on a constaté que les acheteurs qui lui ressemblent aiment bien ce produit, ou encore prévoir des stocks de bière et de chips la veille de France-Angleterre (stocks pondérés selon la météo), ce n'est pas spécifique à Internet. Observer de manière fine les clients non plus.

Je crois plutôt que c'est une question de taille de structure. Comme vous l'avez dit, il faut que ce type d'outil soit rentable : ça coûte très cher à mettre en place, à utiliser et à maintenir. On n'en trouve l'utilité qu'à partir d'un certain niveau de vente, niveau à partir duquel on a du mal à imaginer certaines corrélations qui pourraient être intéressantes. Mais qu'on vende en ligne ou de manière plus traditionnelle ne rentre pas trop en compte, à mon avis.

**Cariboo** · 26 Mars 2005

Lafleur, tes propos sont clairement de bon sens.

Dans ce domaine, rien de "révolutionnaire" n'a été inventé. Il s'agit juste d'avancées technologiques.

En plus, Amazon fait partie des cas atypiques : la plupart des sociétés de VPC qui tiennent le choc dans la durée sont des "click and mortar", comme la Redoute, ou les 3 Suisses. Elles ont pourtant parfois investi tardivement, prudemment sur le net, et ont rarement "expérimenté", mais plutôt étendu des méthodes testées depuis de longues années sur les systèmes de vente on line.

Ceux qui savaient faire de la vente par téléphone depuis 30 ans ont appris sans trop de difficulté à vendre sur internet.

Par contre, la logistique ne s'improvise pas, comme dit Lafleur, et beaucoup de start'up se sont plantées parce qu'elles ne savaient pas gérer les flux de stocks, les achats etc...

Par contre, je pense que certains types de data mining sont à la portée de sociétés modestes, et peuvent être rentables. Mais comme je l'ai expliqué, à condition d'avoir les ressources nécessaires en interne.

Ques sont les problèmes de scaling d'amazon dont tu parles cariboo?

On peut écrire de jolis logiciels de data mining et de calculs statistiques qui tournent très bien en laboratoire sur un pc de base. Mais quand on s'appelle Amazon, on s'amuse à traiter des quantités de données gigantesques, ce qui oblige à résoudre des problèmes complexes comme :

- créer une architecture distribuée entre plusieurs machines pour le repository

- inventer une manière performante pour "requêter" les bases

- inventer des algos pour travailler sur des matrices de taille importante

etc...

Et ça, ce n'est pas à la portée du premier ingénieur venu...

Le pc banking concerne des transactions qui se font sur le net et par conséquent il s'agit de E-commerce. Mais je ne pense pas que le data mining ait une nécessité quelconque
dans ce milieu de la banque et de l'assurance en ligne. Est-ce que je me trompe ou est-ce que le mining n'a pas du tout boulversé ce milieu là?

Le data mining a bouleversé ce milieu là, mais bien avant que le web soit inventé. Dans l'assurance, le métier d'actuaire, c'est du data mining appliqué à l'évaluation des risques, et du profiling d'assuré. Dans la banque, on aime bien aussi faire tourner les ordinateurs pour déterminer les clients "à risque" et les "bons pères de famille". C'est ce que l'on appelle le scoring, et c'est aussi issu des méthodes du data mining. C'est très ancien, notamment lorsque l'on parle du "scoring" de solvabilité en matière d'entreprises.

Les sociétés de crédit jouent aussi beaucoup avec ces méthodes de scoring.

Mais que ce soit dans le domaine des assurances, ou (surtout) dans le domaine de la banque, ces méthodes d'évaluation sont en-ca-drées par la loi. C'est un sujet particulièrement sensible, sur lesquels banques et sociétés d'assurance n'aiment pas communiquer.

Ce data mining se fait sur des données le plus souvent récupérées "off line", donc c'est pour cela que tu as l'impression que rien ne se fait "on line".

Sur le site de Fnac quand on va sur un cd, on peut voir "les personnes ayant acheté ce cd ont aussi acheté ceux-cis..." avec une liste de cd qui apparait en bas de la page.
Est-ce deux types de choses ont été apportées par le data/web mining ou bien ça n'a rien à voir avec le mining? ou bien ça dépend de la taille des sites. Anonymus avait l'air de dire que ça n'était pas du web mining :S

Nicolas a raison, c'est un mining super simple... Une simple requête sur les commandes suffit : "compte le nombre articles commandés par les clients dont une commande contient l'article affiché, et affiche les dix premiers résultats par ordre de nombre de commandes" et hop !

Ce que fait Amazon est plus sophistiqué, mais pas beaucoup plus impressionnant... Il s'agit de prévoir les articles qui peuvent intéresser un individu en fonction de son profil d'acheteur... Dans son "profil" sont pris en considération des informations plus étendues que ce qu'il a déjà commandé.

**thick** · 26 Mars 2005

Trés intéressant votre discussion.

Je me demandais comment sont inclus les spywares dans la statégie de WebMining ?

Est-ce qu'on en parle dans les mises en place de stratégies ou c'est encore quelque chose que les sociétés font mais dont on ne parle pas ?

klelugi · 26 Mars 2005

Salut a tous,

J'ai lu un article recemment et je ne me rappelle plus ou malheureusement...d'un intervenant de chez amazon qui disait qu'ils mettaient au point des technique de suivi de leur clients avec des algorithmes basé sur les types d'achat fait, la date à laquelle ses achats etaient fait et bien d'autres critères qui leur permettait de personnalisé leur relation avec ces clients comme :

Achats de cadeaux de type jouets pour enfants 4 à 5 ans a telle date => envoie d'une carte de joyeux anniversaire l'année suivante avec conseils sur des produits de sexe similaire pour enfants 5à6 ans l'année suivante etc...

Enfin vraiment une étude statistique des achats pour essayer de conforter encore plus le lien vendeur acheteur sur internet...

Si je retrouve la source je vous poste l'URL.

++

SimShaka · 29 Mars 2005

Merci pour vos différents de points de vues je vais essayé de faire une sysnthèse de tout ça.

Je vais indiquer les endroits où le web mining a son influence comme amazon et d'autres où il n'en a pas.

Faudra que je fasse une conclusion que je posterai ici en espèrant que vous me donnerez votre avis dessus

Au fait bravo pour le référencement de votre site:

http://www.google.fr/search?hl=fr&client=f...echercher&meta=

30 Mars 2005

Amazon propose d'autres livres en fonction des livres que linternaute consulte, mais cette information et liée à la page sur laquelle il se trouve et les données proviennent des stats de vente, de ce quont acheté les clients dAmazon mais pas dune information relative à linternaute qui consulte la page.

En revanche pour le prix affiché qui change en fonction du fait que linternaute est déjà client ou pas, c'est le dynamic pricing, qui avait déchaîné les passions quand il avait été mis en place.

Dans ce cas il y a bien une donnée client (dans le sens client/serveur) qui est exploité en "live" puisque qu'un cookie est lu et en fonction de linformation quil recèle le site affiche tel ou tel prix au moment où la page est générée.

Pour ce qui est de l'exploitation en live de données utilisateur et de l'adaptation du contenu en fonction de ses données, peu d'entreprises maîtrisent ces procédés car elles ne disposent tout simplement pas des données.

Google est un cas intéressant car ils disposent des données que leur apporte leur moteur (+AdWords, AdSenses), Gmail, mais aussi la toolbar.

Concernant les données utilisateurs, la toolbar est de loin la plus intéressante.

Je ne mattarderais volontairement pas sur ce sujet car ce n'est pas mon propos aujourdhui, j'avais posté sur WRI à ce sujet:

http://www.webrankinfo.com/forums/highligh...807_.htm#109807

Mon propos concerne MSN et peut être bientôt Yahoo Search Marketing.

Jusqu'ici Overture (et Espotting si l'on souhaite les prendre en compte) à toujours affiché ses annonces uniquement en fonction du bid, c'est à dire de l'enchère.

L'annonceur qui paye l'enchère la plus élevé apparaît en 1ère position.

Google a modifié la donne avec les AdWords en introduisant la notion de CTR associé à l'enchère.

Dans ce cas, ce n'est plus uniquement l'enchère la plus haute qui l'emporte mais aussi le taux de clic.

On ne connaît pas exactement le coefficient du CTR dans cette formule mais une annonce s'affiche en 1ère position alors que l'annonceur paye le clic moins cher que l'annonceur de l'annonce qui apparaît en 2nde position, tout simplement parce que le 1er a un taux de clic supérieur...pas très intéressant (je ne détaillerais pas les effets de lexploitation du CTR), mais on peut dire pour résumer que cela pousse les annonceurs à travailler l'accroche de leurs annonces et aussi à ne pas commencer avec des enchères trop basse.

Pour l'instant, toujours pas d'exploitation de données utilisateur en live me direz-vous ?

C'est la qu'arrive MSN avec MSN AdCenter (avec, je vous le rappelle pour ceux qui n'ont pas lu l'interview réalisée par Cariboo, la France et Singapour en pays test).

MSN Adcenter va afficher ses annonces en fonction de l'enchère. OK, ça on savait, mais aussi en fonction du sexe et de l'âge de l'internaute, ou bien, lorsque l'information ne sera pas disponible (pour environ 20% des internautes français utilisant MSN) en fonction de l'IP, c'est à dire d'une estimation de géo localisation.

C'est la que c'est nouveau par rapport à ce que font Google et Overture.

Je vois dici les esprits chagrins me demander: mais d'où vient l'information de l'âge et du sexe ? Et les autres de répondre que l'information vient de.....Passport !

MSN dit posséder quelque chose comme 9M de comptes Passport sur la France soit 80% des internautes venant sur MSN France....oui mais le problème c'est que c'est du déclaratif, en gros c'est l'internaute qui s'inscrit à Passport qui dit s'il est Mr ou Mme et l'age qu'il a, et si ça lui chante de mentir, c'est pas marqué sur son Passport...encore heureux.

Bon, comment ça marche ?

Et bien l'internaute tape la requête "téléphone portable" sur MSN et au moment d'afficher la page, MSN lit le cookie Passport et s'il a 16 ans, il lui affiche une pub de sonneries et de logos et s'il en a 40 il affiche une pub pour le dernier PDA téléphone dernier cri qui coûte bonbon.

S'il ne reconnaît pas de cookie Passport ou bien s'il dispose d'annonces de boutiques qui vendent des portables, MSN pourra afficher la pub de la boutique qui se trouve sur Marseille si l'IP de l'internaute le localise sur Marseille, etc...

Une autre application de l'utilisation de ces données résiderait dans le fait de pouvoir afficher une annonce en priorité aux femmes entre 25 et 45 ans le samedi après midi.

Le problème ? Quand MSN affichera ses annonces sur d'autres moteurs que le sien, AOL par exemple, le pourcentage d'internautes disposant d'un cookie Passport risque de baisser sérieusement....mon petit doigt me dit que Yahoo Search Marketing ne devrait pas tarder à mettre au point quelque chose de similaire car ils en ont les moyens (Mon Yahoo!).

Aujourd'hui MSN dispose du sexe et de l'âge de l'internaute dans son cookie Passport, c'est peu mais c'est déjà mieux que ses concurrents.

Google innovera peut être encore avec un panel plus large et un niveau d'information plus poussé (CSP) ou plus fiable et de nature différente (tracking comportemental au lieu du déclaratif sexe, âge, CSP) ?

Vous en connaissez beaucoup dentreprises qui disposent de ce type dinformations sur un panel dinternautes représentatif cookifiés, afin de pouvoir les exploiter en live sur le Net ?

En France, à part celle que nous venons de citer, je vois Weborama...et cest tout.

Modifié 30 Mars 2005 par Turulillo

Kimberlyclarko · 30 Mars 2005

Weborama annonce 300 000 membres, chez Mediametrie (Nielsen/Netrating), je crois qu'ils ont un panel de 30 000 utilisateurs. La question est de savoir à partir de quel moment on peut considérer qu'il s'agit d'un panel "représentatif"...

L'idée de personnalisation des sites n'est pas nouvelle (le fameux one to one )

cf cet article qui date de 2000 (surtout les 2 derniers paragraphes).

Mais peu de sites on réellement réussi à appliquer ce principe... Reste à savoir si les moteurs y arriveront. La difficulté étant d'agréger les données pertinentes dans une base unique et d'y associer un modèle statistique efficace afin d'optimiser le ciblage. Il y a tellement de données disponibles sur le comportement des internautes qu'il faut, comme le dit Cariboo, de très fortes compétences et de gros moyens pour en tirer quelque chose... Mais on peut imaginer que sur la base d'un panel, on peut savoir par exemple qu'un internaute qui recherche "mp3" sur MSN depuis paris avec Firefox entre 23h et 2h et dont le FAI est Free a X fois plus de chances d'être un jeune homme qu'un internaute qui recherche "loisirs créatifs" le samedi après-midi sur ie/wanadoo... Les recoupements type Amazon peuvent également être introduit dans le modèle : ceux qui ont cherché la requête X ont également recherché la requête Y. Là aussi, ça fait beaucoup de données à traiter

Depuis le temps qu'on en parle, j'attend toujours de voir...

Monique · 30 Mars 2005

Bonjour,

J'ai un peu fouillé et je me contente d'apporter quelques liens

Zoom, Moteur de Recherche Sémantique

Un site commercial (proposant des logiciels), quelques articles simples et concrets.

SPSS, l'analyse statistique des données

Un site commercial, exemples d'utilisation pour le e-commerce.

Soft Computing expert en Data Mining

Une plaquette promotionnelle (format pdf) assez riche en information à propos de l'impact en e-commerce.

Fouilles de données (Data Mining) & Acquisition de connaissances

Un document pdf... que je n'ai pas lu :blush:

Gilles Balmisse - Outils de knowledge management, de travail collaboratif et de veille

Un blog très intéressant avec des rubriques comme Intelligence économique, Knowledge management, Data mining...

SimShaka · 3 Avril 2005

Merci bcp pour votre aide, j'ai terminé mon travail et pour ceux que ça intéresse voilà ma synthèse:

Ces dernières années, on a pu observer une véritable explosion du nombre de systèmes dinformation, tant sur Internet quen Intranet. Avec le nombre toujours croissant de données disponibles, les Internautes sont confrontés à une quantité trop grande de données fournies par les moteurs de recherche. Cest pourquoi, afin dobtenir des résultats plus succincts, il est nécessaire de disposer doutils capables danalyser ces masses de données et den extraire des informations utiles, pour obtenir des connaissances exploitables et des modèles.

Parallèlement, le E-commerce connaît lui aussi un succès grandissant. On observe une diversification accrue de loffre pour un nombre toujours croissant de personnes connectées au Net. Les données générées par tous ces achats ne cessent daugmenter et leur exploitation en vue de mieux comprendre le comportement des acheteurs peut procurer un avantage concurrentiel intéressant.

Dans ces deux domaines, il existe un outil capable de répondre à ces besoins : le Web Mining, qui consiste à utiliser l'ensemble des techniques du Data Mining pour développer des approches et des outils permettant d'extraire des informations pertinentes à partir de données du Web (documents, traces d'interactions, structure des pages, des liens...).

Le Web Mining est utilisé par les plus gros sites de vente en ligne et son influence sur ceux-ci est plus que palpable. Ces sites de ventes en ligne ont développé un Marketing en One to one de plus en plus présent et arrivent à adapter loffre à léchelle mondiale. Ainsi, leurs offres publicitaires sont fonction des préférences de lInternaute et de sa localisation géographique. Pour cela, les parcours de linternaute sur le site et ses achats sont stockés afin dadapter le site qui lui est proposé en temps réel. Ensuite, on analyse la rentabilité.

Si loutil quest le Web Mining a bouleversé le monde des gros calibres du E-commerce, il existe encore des domaines où il na rien changé, même sil nest pas exclu quil y parvienne, étant donné sa récente apparition. Il en est ainsi notamment dans le PC-Banking ou les sites web dassurances qui comportent des transactions financières sur Internet et se situent donc dans le E-commerce. Ces institutions financières ont été bouleversées par le Data Mining bien avant que leurs activités ne soient transposées sur le Web.

Peu de sites utilisent aujourd'hui ces outils. Malgré leur intérêt évident, leur utilisation nécessite, en effet, la mobilisation de ressources qui sont rarement toutes présentes dans les services Internet dentreprises: des statisticiens, des informaticiens ainsi que des personnes ayant des bonnes connaissances en algorithmique. Il est certes possible de faire appel à des sociétés spécialisées dans ce domaine, mais cela coûte très cher.

Outre ce problème des ressources disponibles, il existe aussi une question dinfrastructure. En effet, ce nest quà partir d'une certaine taille de bases clients ou de bases de membres, quon peut opérer des calculs statistiquement pertinents et ce nest qu'à partir d'un certain niveau de ventes quon peut mettre en évidence des corrélations exploitables.

Le Web Mining est donc en train de bouleverser le monde du E-commerce. Même sil reste mathématiquement impossible de déterminer exactement ce quun Internaute veut, avec le nombre grandissant dachats en ligne et des puissances de calcul de plus en plus importantes, lavenir est particulièrement prometteur dans ce domaine.

et voilà ma conclusion:

Le plus grand défi pour le Data Mining est ce que les experts qualifient comme insolvable et qui justifierait le scepticisme de beaucoup : trouver quelles personnes sont susceptibles dacheter en se basant sur des transactions précédentes, des informations démographiques et dautres points de repères.

Le Data Mining est un bon prédicateur du comportement du consommateur mais est basé sur des comportements passés.

Si on pouvait déterminer ce que les gens voudraient acheter, par opposition à ce quils peuvent se permettre, ce serait une clé de réussite pour gonfler les marges bénéficiaires, ce qui est le but recherché de tout commercial.

Mais on ne saura jamais prédire exactement ce que les gens veulent vraiment, car cest mathématiquement impossible à déterminer.

Le Web Mining à changé la donne, car il permet une optimisation de l'offre à l'échelle mondiale. Les sites qui lutilisent sont devenus les premiers supermarchés mondiaux.

Quand on voit les capacités et la pertinence d'analyses de gros vendeurs tel quAmazon.com, ou shoes.com, on peut se dire que les sites de E-commerce qui n'utilisent pas de "tracking proactif" risquent de plus en plus de se retrouver largués par toutes ces autres plateformes qui personnalisent loffre au client selon ses données utilisateur, ses achats, ses parcours dans le site, ses préférences ou encore sa localisation.

Mais il y a différents paramètres à prendre en compte :

- les habitudes des consommateurs ne sont pas encore fixes ; d'ailleurs, les futurs consommateurs du Web n'ont pas forcément un ordinateur et Internet chez eux.

- les puissances de calcul, nécessaires pour ce genre de statistiques sont assez grandes,

- Il faut que ce type d'outil soit rentable ; cela coûte très cher à mettre en place, à utiliser et à maintenir. Pour quil le soit, il est nécessaire que la taille de la structure soit importante. Ce nest quà partir d'une certaine taille de bases clients, ou de bases de membres, quon arrive à faire des calculs statistiquement pertinents et ce nest qu'à partir d'un certain niveau de vente, quon aura certaines corrélations intéressantes.

Quant à savoir si les gros sites tels quAmazon, ont acquis grâce à ces technologies des parts de marchés ainsi quun avantage irréversibles, cest relativement compliqué à déterminer. Même si on voit mal un géant comme Amazon disparaître, le monde de linformatique et de lInternet évolue rapidement et les portes ne sont pas définitivement fermées sur ce marché.

Cest pourquoi jestime quavec le nombre grandissant de personnes connectées à Internet et dachats sur les plateformes de ventes en ligne, couplé à des puissances de calculs de plus en plus importantes, l'avenir du Web Mining, qui nen est quà ses débuts, a encore de beaux jours devant lui.

Je me suis beaucoup inspirés de livres américains pour ce travail et aussi de certaines phrases de ce topic.

Modifié 3 Avril 2005 par SimShaka

bshop · 5 Avril 2005

Excellent sujet, et gros travail de reflexion de chacun, bravo...

Connexion

Le Web Mining a-t-il révolutionné le E-commerce?

Sujets conseillés

SimShaka

ams51

SimShaka

ams51

Cariboo

Anonymus

guilcorp

SimShaka

Anonymus

Magicoyo

Cariboo

SimShaka

SimShaka

lafleur

Cariboo

thick

klelugi

SimShaka

Guest Turulillo

Kimberlyclarko

Monique

SimShaka

bshop

Veuillez vous connecter pour commenter

Parcourir

Activité