Tu peux le voir à l'aide de la commande "site:" dans Google
Normalement, tu verra la liste des pages indexées :
http://www.google.fr/search?sourceid=navcl...2Efr%2Fannuaire
Quand les pages sont trop similaires, tu aura un résultat qui ressemble à ça :
http://www.google.fr/search?hl=fr&rls=...sadhu&meta=
Note que dans ce cas ça montre une certaine faiblesse de Google, car chaque page a vraiment un contenu original. Mais le schema de nommage des pages (title), la balise meta description générique, et le contenu restreint font que ces pages apparaissent comme similaires.
(Tiens ça me donne une idée de test ça, je vais enlever les meta histoire de voir ce que ça donne )