Eduquer mon robots.txt

  • Auteur de la discussion Geolem
  • Date de début

Geolem

Nouveau membre
Bonjour tout le monde :)

Je possède un modeste Blog Dotclear et bien qu'il y ait peu d'articles intéressant sur celui-ci, je reçois néanmoins des visites.

Seulement voilà, des fois Google (entre autre) index mon site sur les news => là tout va bien, les mots clés introduit dans google mène à la bonne page.
Et des fois, il index la page d'accueil (index.php). Malheureusement dans ce cas, des mots clés introduits lors d'une recherche dans Google pointe sur la page d'accueil mais entre temps la news a été remplacée par d'autres etc...

En gros et résumé, j'aimerais que Google (et les autres), index les adresses "réel" de mon site, par exemple :
[cpp]http://www.lesloulou.net/index.php?2006/07/02/1-first-post[/cpp] ou encore [cpp]http://www.lesloulou.net/index.php?2007/04/23/263-notre-code-wii[/cpp]

Mais pas [cpp]http://www.lesloulou.net/index.php[/cpp]

Pour que par exemple dans le cas du lien sur mon code Wii (au passage vous m'ajouter dans vos amis Wii si vous le souhaitez, consulter mon profil sur le forum), si je tapais admettons "code wii" dans Google, bah que çà référence vers la page ci-dessus et pas la page d'accueil où la news est arrivée une fois...

Alors, j'ai un peu jouer avec les Outils pour WebMaster de Google qui permet de tester les robots.txt et visiblement ceci a l'air de fonctionner :
[cpp]User-agent: *
Disallow: *
Disallow: /index.php
Allow: /index.php?[/cpp]

J'ai testé ces urls variées là :
[cpp]http://www.lesloulou.net
http://www.lesloulou.net/

http://www.lesloulou.net/index.php?2007/04/23/263-notre-code-wii

[/cpp]

Et voici le résultat :
[cpp]http://www.lesloulou.net Bloquée par la ligne 2 : Disallow: *
http://www.lesloulou.net/ Bloquée par la ligne 2 : Disallow: *
Identifié comme répertoire ; certains fichiers peuvent être soumis à des restrictions différentes.
Bloquée par la ligne 3 : Disallow: /index.php
Autorisée par la ligne 4 : Allow: /index.php?
Autorisée par la ligne 4 : Allow: /index.php?[/cpp]

Ce dont je crains, c'est que si j'interdis le /index.php, est-ce que Google viendra néanmoins m'indexer ?
Est-ce que l'ordre dans les déclarations du robots.txt a une importance ? (comme une règle d'ACL dans les routeurs/firewall)

Merci d'avance de l'attention que vous m'apporterez.
 

zeb

Modérateur
(Pas sûr que ce soit de la programmation. Comme je ne sais pas où déplacer, je laisse ouvert.)
 

Geolem

Nouveau membre
Je ne savais pas trop où le mettre vu qu'il n'y a pas de forum pour les sites Web... Alors vu que les sites Web, c'est entre autre du PHP, que mon blog est en PHP, c'est pour çà que j'ai pris ce forum... Je voulais le mettre au départ dans HTML mais bon...

Je me dis que tout ceux qui programme en PHP, doivent avoir un site et donc un minimum de référencement avec notament le contrôle des accès aux pages...

:-/
 

zeb

Modérateur
(Pas sûr que ce soit de la programmation. Comme je ne sais pas où déplacer, je suis l'humble avis de Boub :merci: )
 
Vous devez vous inscrire ou vous connecter pour répondre ici.
Derniers messages publiés
Statistiques globales
Discussions
730 098
Messages
6 717 064
Membres
1 586 286
Dernier membre
petitangebleu1977
Partager cette page
Haut