Aller au contenu

Sujets conseillés

Posté

Salut je me pose quelques questions sur les séparateurs et nom de fichier (URL)

1) le "." c'est juste pour les extension ou on peux avoir un nom de ficher : machin.bidule.htm ?

2) le "." est il un séparateur pour Google : machin.bidule = machin et bidule ?

3) la "," est un séparateur (normal) cela veux dire que ca ne pose pas de probleme d'appeller un fichier machin,bidule ?

4) la "," est elle mieux que l'apostrophe (url, séparateur), pourquoi ?

5) "_" n'est pas un séparateur, ca veux dire que machin_bidule = machin_bidule et noon machin et bidule ?

6) quels sont tous les types de séparateur qui fonctionne aussi bien que "-" sans auccun probleme pour Url, réferencement ... ?

7) pour en finir avec la légende de l'apostrophe tout le monde semble dire qu'elle marche pas (parceque personne ne l'utilise) mais y a t il vraiment des gens qui on eu des problemes avec. Pouvez vous me dire si vous avez des probleme avec l'apostrophe si vous etes sous UNIX (serveur ou ordi) et si vous etes sous MAC. Car ca se trouve il n'y a pas de prob est c'est peut etre un bon séparateur (car meme si je suis pas PIVOT, si l'apostriphe ne pose pas de prob (serveur et ordi unix, mac) j'y vois de grandes perspectives) ?

Posté (modifié)

Re-bonjour,

Puisque j'avais déjà essayé de répondre à une partie de ces questions sur WRI. ;)

1. Sur Unix et dérivés, un nom de fichier peut contenir plusieurs points. il ne faut pas confondre URL et nom de fichier. Avec l'URL rewriting, on peut à peu près tout faire comme manipulation sur l'URL avant d'en transformer une partie en nom de fichier.

2. oui, le point est un séparateur pour Google.

3. oui, idem pour la virgule.

4. pour Google, mes tests montrent que l'apostrophe fonctionne comme séparateur. Pour certains browsers particuliers ou dans certaines configurations de langue, je ne sais pas quels problèmes peut amener l'apostrophe.

5. Le souligné n'est pas un séparateur. Si tu écris machin_bidule, Google y reconnaït un seul mot "machin_bidule". Par contre, si tu emploies un vrai séparateur (exemple: machin-bidule), Google y reconnaît deux mots "machin" et "bidule".

6. "Googleguy" qui est une sorte de porte-parole de Google conseille de se limiter au point, à la virgule et au tiret.

7. voir 4.

Confronté à un problème similaire avec des noms de localités, j'ai créé un index où tous les caractères spéciaux sont convertis en tirets, tout en créant une table qui redonne le nom correct quand on donne l'index.

Exemples :

- l'index "rhode-saint-genese" donne le nom exact "Rhode-Saint-Genèse (Sint-Genesius-Rode)";

- l'index "fexhe-le-haut-clocher" donne le nom exact "Fexhe-le-Haut-Clocher".

De cette manière, je gère les apostrophes, les caractères accentués, les minuscules et majuscules et le bilinguisme de certains noms.

Jean-Luc

Modifié par Jeanluc
Posté

ben voila tu as la solution peux tu me faire partager ton script car c'est exactement le meme probleme et commen tu fais pour les apostrophes

Posté

Pour les apostrophes, ça donne l'index "mont-de-l-enclus" correspondant à "Mont-de-l'Enclus".

Je ne peux pas te passer le code source, mais je peux te donner quelques infos complémentaires. Partant des noms de localités, en utilisant des expressions régulières, j'ai créé un tableau avec les index et les noms de localités que j'ai sauvegardé une fois pour toutes dans un fichier. Les applications relisent le fichier. Au moyen d'un "hash" (tableau associatif ?), elles retrouvent les noms de localité à partir de l'index.

Jean-Luc

Posté

J'y connait pas grand choses et la je comprend pas tout

par exemple le fichier "clermont-l'herault.php"

tu l'ecris comment ?

c'est quoi la procedure a partir de cet exemple

Posté

Je l'écrirais "clermont-l-herault.php" ou plutôt "clermont-l-herault.html". L'URL "clermont-l-herault.html" serait convertie par url rewriting en "ville.php?code=clermont-l-herault". Ensuite, le programme "ville.php" va lire une table où il voit que "clermont-l-herault" correspond à "Clermont-l'Hérault".

Yes ?

Jean-Luc

Posté

est ce que quelqu'un sait ce que cel

a veut dire :

2.3. Unreserved Characters

  Data characters that are allowed in a URI but do not have a reserved

  purpose are called unreserved.  These include upper and lower case

  letters, decimal digits, and a limited set of punctuation marks and

  symbols.

      unreserved  = alphanum | mark

      mark        = "-" | "_" | "." | "!" | "~" | "*" | "'" | "(" | ")"

  Unreserved characters can be escaped without changing the semantics

  of the URI, but this should not be done unless the URI is being used

  in a context that does not allow the unescaped character to appear.

This does appear to change the list allowed from that in 1738.

Specifically,

$+, all seem to be less wonderful to use unescapesd. The RFC earlier

says:

      reserved    = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" |

                    "$" | ","

The RFC's are sometimes hard work to trawl through, but they can be

worth it... but this isn't an RTFM! ;-)

In short, an apostrophe's fine, by the looks of it.

L'apostrophe est elle utilisable dans un nom de dossier ou fichier

est ce que www.machin.com/bidul'chouet/sup'meg.php ne pose pas de probleme comme adresse d'apres la sitation précédente

@+

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...