Dans cet article
  • Pourquoi le crawler Pinterest accède à votre site Web
  • Comment le crawler Pinterest accède à votre site Web
  • Vérifier le crawler Pinterest
  • Empêcher ou limiter l'accès de Pinterest à votre site
  • Pour vous aider à découvrir et faire ce qui vous plaît le plus, les utilisateurs de Pinterest ont créé une base de données contenant des milliards d’Épingles sur Pinterest. Afin de préserver la sécurité de nos utilisateurs et d’offrir un contenu de bonne qualité, nous utilisons des robots d’indexation pour identifier les données sur les pages associées aux Épingles. Afin d’aider les utilisateurs de Pinterest à passer à l’action lorsqu’ils se sentent inspirés, nous utilisons également l’indexation pour créer des Épingles Produit disponibles à l’achat et les rediriger vers les sites Web des commerçants. Cela peut contribuer à augmenter le trafic organique, les ventes et les conversions sur ces sites Web, avec un minimum d’effort pour les commerçants.

    Les pages liées aux Épingles contiennent des signaux détaillés qui nous aident à proposer de meilleures suggestions, lutter contre le spam et afficher des informations utiles. Pour bien utiliser ces signaux, nous récupérons, conservons et traitons régulièrement le contenu de la page associée aux Épingles.​

    Pourquoi le crawler Pinterest accède à votre site

    Le crawler Pinterest accède à votre site Web pour trois raisons principales :

  • Pour collecter des informations comme le prix, la description et la disponibilité de vos produits
  • Pour s'assurer que les internautes peuvent se rendre sur le site en toute sécurité
  • Pour créer des Épingles et vous éviter d’avoir à le faire
  • Comment le crawler Pinterest accède à votre site Web

    Lorsque le véritable crawler Pinterest visite votre site Web, il enverra un agent utilisateur Pinterest valide et se connectera à partir d'un réseau qui est géré par nos soins.

    Le crawler Pinterest respecte le protocole d'exclusion des robots (robots.txt) et est configuré pour limiter automatiquement le taux de requêtes simultanées adressées à votre site Web. Veillez à ne pas coder ces adresses IP de la configuration de votre site, car les adresses utilisées par le crawler peuvent être modifiées sans préavis.

    Notre agent utilisateur est :

    Pinterest/0.2 (+https://www.pinterest.com/bot.html)
    Mozilla/5.0 (compatible ; Pinterestbot/1.0 ; +https://www.pinterest.com/bot.html)
    Mozilla/5.0 (Linux ; Android 6.0.1 ; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible ; Pinterestbot/1.0 ; +https://www.pinterest.com/bot.html)

    Notre adresse IP est dynamique et change souvent, mais elle sera toujours comprise entre 54.236.1.001 et 54.236.1.255.

    Crawling géodistribué

    Le crawler Pinterest explore principalement les adresses IP basées aux États-Unis. Nous pouvons également explorer des adresses IP basées dans d'autres pays afin de prendre en compte les données localisées.

    Les adresses IP basées aux États-Unis commencent toujours par 54.236.1.XXX.

    Pour les adresses IP situées hors des États-Unis, il n'y a pas de plage spécifique. Si vous craignez que des utilisateurs accèdent à votre site Web en faisant semblant d'être le crawler Pinterest, vérifiez l'authenticité de ce dernier en suivant les étapes reprises à la section suivante, plutôt que de vous fier à une vérification de la plage d'adresses IP.

    Vérifier le crawler Pinterest
  • Utilisez la commande host pour lancer une recherche DNS inversée sur l'adresse IP depuis vos dossiers
  • Vérifiez que le domaine de la réponse se termine par pinterest.com ou pinterestcrawler.com
  • Utilisez la commande host pour lancer une recherche DNS non inversée sur la réponse récupérée de l'étape 1
  • Vérifiez que l'adresse IP est la même que celle obtenue lors de l'étape 1
  • Si vous recevez un volume de trafic cohérent d'un client envoyant un agent utilisateur Pinterest valide, mais que le test DNS précédent échoue, veuillez nous contacter.

    Empêcher ou limiter l'accès de Pinterest à votre site

    Pour modifier le comportement du crawler Pinterest, vous devrez mettre à jour le fichier robots.txt sur votre site. Veillez à placer le fichier robots.txt dans votre domaine principal, car nous ne prenons pas en charge les fichiers robots.txt dans les sous-domaines.

    S'ils sont trop élevés, les paramètres Crawl-delay ont un impact sur la distribution et la recommandation de votre contenu sur Pinterest. Par conséquent, nous acceptons que ce paramètre soit inférieur ou égal à 1 et nous traiterons les valeurs supérieures comme si elles étaient égales à 1. Si vous avez besoin d'un paramètre crawl delay supérieur, contactez-nous.

    user-agent: Pinterestbot
    Crawl-delay: 0.2
    user-agent: Pinterestbot
    disallow: /
    user-agent: Pinterestbot
    disallow: /directory1/
    user-agent: Pinterestbot
    disallow: /directory1/
    allow: /directory1/subdirectory1/
    user-agent: Pinterestbot
    disallow: /directory1/
    allow: /directory1/subdirectory1/
    crawl-delay: 0.2
    End of Other articles Links
    Vous avez encore besoin d'aide ? Nous contacter
    User feedback
    Cet article vous a-t-il été utile ?

    collection_fields

    Comment pouvons-nous améliorer cet article ?