Bienvenue sur le forum d'entraide d'OverBlog.
Nous vous conseillons de chercher une réponse sur notre base de connaissances avant de poster une demande sur le forum.
[RÉSOLU] Robots.txt
  • Bonjour,


    alors en toute première chose je ne m'y connais pas en programmation réseau. J'ai glané des informations sur internet sur les robots.txt. Lorsque je vais dans google mon code donne ça :

    User-Agent: *
    Allow: /
    Disallow: /contact
    Disallow: /mail/subscribe
    Disallow: /mail/valid-*

    Sitemap: /sitemap.xml
    Sitemap: /sitemap-news.xml

    User-agent: msnbot
    Crawl-delay: 5

    User-agent: bingbot
    Crawl-delay: 5

    Google me dit qu'il y a des erreurs dans le code et il semble que ce code bloque l'accès à certaine de mes pages, d'après ce que j'ai compris. Ais-je bien compris ? Si effectivement ce code bloque l'indexation de certaines de mes pages j'aimerais les débloquer.

    Petite question au passage des URL : est-ce gênant qu'il y ait des espaces dans le nom de la page dans l'URL?

    Merci par avance. Bonne journée.
  • Bonjour,

    overblog gère le robot txt. on y a pas accès

    il bloque certaines ressources 

    Disallow: /contact
    Disallow: /mail/subscribe
    Disallow: /mail/valid-*

    (formulaire de mail etc...) c'est normal

    concernant les url, les espaces sont toujours remplacés par un