Aller au contenu

Cariboo

Membre+
  • Compteur de contenus

    3 376
  • Inscrit(e) le

  • Dernière visite

Tout ce qui a été posté par Cariboo

  1. Merci ohax d'en avoir parlé. Accoona prétend révolutionner la recherche avec un truc de "retour de pertinence" pour diminuer le bruit et un peu d'IA pour améliorer le rappel. Cela fait des années que tout le monde sait faire ça. Google aussi, ils ne l'ont pas fait parce que leurs tests (selon eux) ont démontré que les internautes préféraient avoir leurs résultats. Quant à l'utilisation de l'IA pour déterminer le sens de la requête... Sur un mot je me marre... Sur deux, dur dur... Sur trois ou quatre, la supériorité de l'IA sur une mesure de similarité n'a jamais été très évidente... Saluons quand même l'apparition d'un nouvel acteur dans le monde de la recherche. Ils ne sont pas si nombreux.
  2. J'ai mis en ligne dans la partie publication une version pdf des slides de l'intervention que j'ai faite au à l'occasion de Netmarketing 2004 avec François Bourdoncle, PDG d'Exalead, sur la sémantique appliquée et la linguistique statistique dans les moteurs de recherche, et ses utilisations dans le référencement. J'en profite au passage pour remercier François Bourdoncle pour son indulgence , et pour avoir su parfaitement illustrer par des exemples tirés du fonctionnement d'Exalead, des propos qui sinon seraient restés parfaitement abscons et abstraits. Slides Netmarketing 2004
  3. Les trophées ont été attribués le 2 décembre. Voici un lien vers la liste des lauréats : Les trophées du Netmarketing 2004
  4. Bonjour Mélanie et bienvenue... Pour l'autre dont tu ne connais pas le nick, son pseudo c'est Anonymus (non ce n'est pas une blague !! )
  5. L'exemple de Moffen me permet de donner une "condition" à remplir pour que cela marche. En fait, il faut que les pages de résultats apparaissent dans un domaine, ou un sous domaine, dont la thématique est déjà déterminée par le système adsense. Dans ce cas, le système renvoie un minimum d'annonces caritatives.
  6. Chouette !! Je vais enfin pouvoir virer tous les outlook sur les postes de ma boîte. Génial...
  7. J'ai testé et cela donne des résultats excellents... si on veut soutenir les oeuvres caritatives !
  8. Il faut créer un nouveau fil "avec sondage" en cliquant sur le bouton "sondage" en haut de la page
  9. C'est vrai que cette affaire a contribué surtout à ternir encore un peu plus l'image des référenceurs... C'est fou de voir à quel point ce métier commence à avoir mauvaise réputation. Ce n'est pas nouveau, dans mon boulot j'ai éconduit pendant des années tous les référenceurs qui me sollicitaient, en grande partie par peur de me faire "arnaquer". En 2001/2002, les problèmes de blacklistage ne faisaient pas la une des journaux, par contre le discours de "camelots" ou de "marabouts africains" de certains soi disant professionnels avaient achevé de me convaincre que des cuistres, voire des escrocs se cachaient derrière ces soi-disants référenceurs... Mais à la suite de cette "crise médiatique" sur les déréférencements, c'est maintenant le grand public qui a reçu un message clair : "méfiez vous des référenceurs". Reconstruire une image positive ne sera pas chose facile pour cette profession...
  10. La clause qui indexe la prime sur le CA est normale et très répandue. Elle à mon avis pleinement justifiée pour une assurance RC+perte d'exploitation.
  11. Effectivement, ça c'est une bonne nouvelle... Tagger les adsenses par les channels peut-être assez fastidieux, et l'expérience prouve que l'on peut commettre des erreurs... Ceci-dit, les "channels" restent utiles parce que le classement par url n'est pas toujours pertinent...
  12. Ouf ! Voila la quatrième et dernière partie de la traduction publiée... Dans cette partie, le professeur Garcia nous donne quelques pistes d'utilisation possibles pour son système, donne la formule de calcul des indices de co-occurences ainsi qu'une liste de références bibliographiques très intéressantes... Quatrième partie de l'article "on topic analysis"
  13. Il évident néanmoins (on peut en faire facilement l'expérience) que le pagerank donné par la toolbar est déconnecté du PR utilisé dans les pages de l'index ... Ou alors Google oublie de nous dire quelque chose d'important... Pourquoi ? Parce que l'on peut observer que lors des changements dans l'index, les PR indiqués par la toolbar ne bougent pas. Quand les PR indiqués par la toolbar changent, cela ne se traduit pas (toujours) par des changements dans les classements. Googleguy avait lâché une information dans le passé laissant penser que l'interrogation des backlinks et des PR de la toolbar sollicitait des bases spécifiques, déconnectées de l'index (pour des raisons de performance probablement). On sait notamment par exemple que c'est la capacité limitée des serveurs chargés de stocker les "backlinks" qui a obligé Google dans un premier temps à ne communiquer qu'un nombre limité de backlinks aux webmasters... Cette limitation a ensuite "sauté", mais la limite est restée... Aujourd'hui, on peut sans doute affirmer sans dire trop de bêtises que le PR indiqué par la Toolbar est une "photographie" des PR de l'index prise à un instant T, et que le PR indiqué est donc toujours un PR ancien... Que Googleguy nie que cela soit une information donnée pour la galerie, cela peut se comprendre, et il est peut-être même sincère en disant que ces chiffres sont donnés parce que Google pense que cela apporte un plus à la toolbar. Mais il n'en demeure pas moins que quelques observations simples et ses propres déclarations passées enlèvent du poids à ses dénégations. Par contre, il a raison de rappeler qu'un post qui rapporte sans le sourcer un pseudo mail d'un hypothétique employé de Google tenant des propos dont la véracité est invérifiable doit quand même susciter un regard critique.
  14. Une précision : l'obligation légale de rendre un site public accessible n'implique pas d'obtenir le label accessiweb... Juste de rendre son site accessible. Par ailleurs, l'"obligation" s'adresse aux administrations centrales, et aux collectivités territoriales, pour les collectivités locales, il s'agit juste d'une "incitation". Enfin, je ne sais pas si le décret d'application est paru ?
  15. A lire attentivement les annonces, il semble que ces quality testers vont tester (aussi) de nouvelles fonctionnalités de google... On nous préparerait quelque chose ?
  16. Une critique sans doute justifiée... Merci d'avoir ramené tout cela à sa juste proportion. Oui, je suis d'accord avec toi. Si le débat reste uniquement franco-français, c'est ridicule. La francophonie est sans doute l'espace minimum pour agir... Et encore... En tant que client de référenceurs, je ne peux qu'acquiescer... Même si j'ai fait mon éducation tout seul, et si j'ai pu choisir les prestataires en connaissance de cause, je n'ose imaginer comment d'autres choisissent...
  17. Il n'y a aucun problème pour faire communiquer flash avec php/mysql Un tutoriel très simple pour apprendre à le faire de manière simple... http://www.flashxpress.net/index.php?f_dyn...y_php/flash_sql Utiliser des squelettes spip ensuite peut se faire sur le même principe...
  18. Le droit français de la propriété intellectuelle est très spécifique. Plusieurs dispositions n'ont pas d'équivalent dans la législation de nombreux pays. C'est pourquoi certains ont jugé utile de créer des licences plus conformes à nos particularismes. Néanmoins, la "supériorité" de ces licences "nationales" sur les GNU/GPL et autres ne me parait très évidente... Les "ajouts", soit n'ajoutent rien parce qu'il s'agit de dispositions d'ordre public, soit sont des clauses qui risquent de s'avérer peu solides devant les tribunaux. En fait, ce qui manque surtout c'est une jurisprudence suite à des procès pour violation de ces licences, qui démontrerait la nécessité de "préciser" tel ou tel aspect dans les contrats de licence. Pour l'instant, il n'existe rien de tout cela, donc, le débat juridique autour de ces "licences" reste assez théorique... A titre personnel, je considère cette initiative comme un pur "cocorico", on verra par la suite la véritable valeur de ces licences. Ceci dit, la valeur juridique de nombreuses clauses des GNU/GPL en droit français est encore plus discutable...
  19. Nos amis américains vivent effectivement depuis plusieurs mois une vaste campagne de blacklistages réguliers de sites... Les "victimes" sont notamment les sites "affiliés" sans contenu réel propre et ce que Google appelle les "aggregators", c'est à dire les sites qui utilisent les agrégateurs de contenu pour créer des métacatalogues... Il semble que Google estime que son devoir est de virer les sites qui génèrent des revenus uniquement grace au référencement... Les webmasters US ont appris à vivre avec... Il va falloir que l'on s'y fasse aussi !
  20. LMS = Learning Management System
  21. Ces outils de suggestion de mots clés sont effectivement assez limités et pas toujours pertinents. C'est vrai aussi pour celui de Google... Je ne saurais trop vous conseiller de les utiliser avec discernement.
  22. Un fonctionnaire peut par contre toucher des droits d'auteur... C'est le seul "emploi" qu'il peut occuper : auteur !
  23. La troisième partie est publiée Troisième partie de l'article "On Topic Analysis" par le Pr E. Garcia Cette troisième partie donne les résultats de l'"expérience".
  24. J'entame la publication aujourd'hui d'une série de 6 articles (plus une annexe bibliographique) sur l'état de l'art en sémantique et linguistique appliquée dans les moteurs de recherche et le référencement... Je publie aujourd'hui le premier article : INTRODUCTION A LA SEMANTIQUE ET A LA LINGUISTIQUE STATISTIQUE Ainsi que la partie "Annexes" avec les références bibliographiques ... LES ANNEXES Et je communique, pour ceux qui veulent suivre le feuilleton, les prochains articles, qui seront publiés d'ici la fin du mois. DEUXIEME PARTIE : LA SEMANTIQUE ET LES OUTILS DE RECHERCHE 1. Quel rôle joue aujourd'hui la sémantique et la linguistique dans les moteurs de recherche grand public ? 2. Les moteurs de recherche actuels utilisant la sémantique 3. La sémantique : comment révolutionner demain la recherche d'information sur le web TROISIEME PARTIE : L'AUTRE SEMANTIQUE - LE WEB SEMANTIQUE ET LA RECHERCHE D'INFORMATION 1. Le Web Sémantique : principes et applications On parle beaucoup de sémantique entre webmasters, mais le terme recouvre plusieurs notions très éloignées. 2. Le Web Sémantique : une utopie condamnée ou une révolution en marche ? Le Web Sémantique à ses militants inconditionnels, mais aussi ses pourfendeurs et ses détracteurs. Quels sont les arguments des uns et des autres ? 3. L'exemple de SEMTAG : le balisage sémantique automatique est possible Créer un outil permettant d'ajouter automatiquement les bonnes balises dans des documents non balisés permet d'envisager de nouvelles applications pour le web sémantique QUATRIEME PARTIE : METHODES LINGUISTIQUES ET SEMANTIQUES DANS LES SYSTEMES D'EXTRACTION D'INFORMATION - Méthodes Statistiques - Analyse Morphologique - Analyse Syntaxique - Evaluation de pertinence : modèle vectoriel contre modèle booléen - L'expansion de requête - Le retour de pertinence - Les thesaurus - L'approche inférentielle de la recherche : algorithmes bayesiens - Le problème de la désambiguation - Les ontologies et les taxonomies - Les relations sémantiques - Théorie probabiliste de l'information de Shannon - Désambiguation probabiliste - Le clustering CINQUIEME PARTIE : APERCU DES ALGORITHMES ET OUTILS MATHEMATIQUES 1. Densité de mots clés, et modèles vectoriels de Salton 2. Les mesures de similarités indice de co-occurence ratio EF cosinus de Salton coefficient de Dice les mesures de similarité conceptuelles : Resnik, Jiang-Conrath, Hirst-St Onge, Wu-Palmer... CINQUIEME PARTIE : APPLICATIONS PRATIQUES POUR LE REFERENCEMENT Savoir sur quelles requêtes se positionner Optimiser son contenu pour le référencement Générer du contenu automatiquement SIXIEME PARTIE : APPLICATIONS PRATIQUES POUR LE KM ET LES OR Elaboration d'un filtre suivant le profil de recherche de l'utilisateur Lemmatisation et utilisation de thésaurus et de bases lexicales Méthodologie de création d'une ontologie Les méthodes d'expansion de requête Trouver les documents pertinents Catégoriser des pages en fonction de leur contenu Applications sophistiquées d'extraction de données sur le web Créer un système de FAQ automatique à la Ask Jeeves ANNEXES LIENS UTILES BIBLIOGRAPHIE
  25. J'ai publié la première et la deuxième partie de la traduction d'un article du Pr E. Garcia baptisé "On Topic Analysis". Il reste deux parties à publier que je mettrai en ligne dans les jours qui viennent... L'article est long, je vous le fais donc savourer en "feuilleton". C'est d'ailleurs comme cela que le Pr Garcia (alias Orion sur Searchenginewatch) avait fait paraître ses premiers articles. Le Pr Garcia a obtenu un Ph. D. de l'université de l'Arizona, et est un spécialiste à l'origine de la chimiométrie et de la géométrie fractale. Il s'est ensuite tournée vers l'intelligence artifielle et les systèmes de recherche d'informations. Sous le pseudo Orion, il a fortement impressionné la communauté anglo-saxonne du référencement en faisant découvrir, par un sujet baptisé "keywords co-occurence and semantic connectivity", comment appliquer les méthodes de sémantique linguistique au référencement. Je publie la traduction "brute de décoffrage" donc que personne ne s'étonne si des corrections sont apportées ultérieurement (les remarques à ce sujet sont les bienvenues). "On Topic Analysis" présente une solution simple pour trouver des termes associés à une thématique donnée en utilisant les pages de résultat d'un moteur de recherche comme source de données... Simple, et efficace, sa méthode, qui a ses limites, est néanmoins applicable à de nombreux domaines comme le référencement ou l'optimisation du positionnement payant. Première partie Deuxième partie
×
×
  • Créer...