Pour vous aider à découvrir et faire ce qui vous plaît le plus, les utilisateurs de Pinterest ont créé une base de données contenant des milliards d’Épingles sur Pinterest. Afin de préserver la sécurité de nos utilisateurs et d’offrir un contenu de bonne qualité, nous utilisons des robots d’indexation pour identifier les données sur les pages associées aux Épingles. Afin d’aider les utilisateurs de Pinterest à passer à l’action lorsqu’ils se sentent inspirés, nous utilisons également l’indexation pour créer des Épingles Produit disponibles à l’achat et les rediriger vers les sites Web des commerçants. Cela peut contribuer à augmenter le trafic organique, les ventes et les conversions sur ces sites Web, avec un minimum d’effort pour les commerçants.
Les pages liées aux Épingles contiennent des signaux détaillés qui nous aident à proposer de meilleures suggestions, lutter contre le spam et afficher des informations utiles. Pour bien utiliser ces signaux, nous récupérons, conservons et traitons régulièrement le contenu de la page associée aux Épingles.
Le crawler Pinterest accède à votre site Web pour trois raisons principales :
Lorsque le véritable crawler Pinterest visite votre site Web, il enverra un agent utilisateur Pinterest valide et se connectera à partir d'un réseau qui est géré par nos soins.
Le crawler Pinterest respecte le protocole d'exclusion des robots (robots.txt) et est configuré pour limiter automatiquement le taux de requêtes simultanées adressées à votre site Web. Veillez à ne pas coder ces adresses IP de la configuration de votre site, car les adresses utilisées par le crawler peuvent être modifiées sans préavis.
Notre agent utilisateur est :
Pinterest/0.2 (+https://www.pinterest.com/bot.html)
Mozilla/5.0 (compatible ; Pinterestbot/1.0 ; +https://www.pinterest.com/bot.html)
Mozilla/5.0 (Linux ; Android 6.0.1 ; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible ; Pinterestbot/1.0 ; +https://www.pinterest.com/bot.html)
Notre adresse IP est dynamique et change souvent, mais elle sera toujours comprise entre 54.236.1.001 et 54.236.1.255.
Le crawler Pinterest explore principalement les adresses IP basées aux États-Unis. Nous pouvons également explorer des adresses IP basées dans d'autres pays afin de prendre en compte les données localisées.
Les adresses IP basées aux États-Unis commencent toujours par 54.236.1.XXX.
Pour les adresses IP situées hors des États-Unis, il n'y a pas de plage spécifique. Si vous craignez que des utilisateurs accèdent à votre site Web en faisant semblant d'être le crawler Pinterest, vérifiez l'authenticité de ce dernier en suivant les étapes reprises à la section suivante, plutôt que de vous fier à une vérification de la plage d'adresses IP.
Si vous recevez un volume de trafic cohérent d'un client envoyant un agent utilisateur Pinterest valide, mais que le test DNS précédent échoue, veuillez
Pour modifier le comportement du crawler Pinterest, vous devrez mettre à jour le fichier robots.txt sur votre site. Veillez à placer le fichier robots.txt dans votre domaine principal, car nous ne prenons pas en charge les fichiers robots.txt dans les sous-domaines.
S'ils sont trop élevés, les paramètres Crawl-delay ont un impact sur la distribution et la recommandation de votre contenu sur Pinterest. Par conséquent, nous acceptons que ce paramètre soit inférieur ou égal à 1 et nous traiterons les valeurs supérieures comme si elles étaient égales à 1. Si vous avez besoin d'un paramètre crawl delay supérieur,
user-agent: Pinterestbot
Crawl-delay: 0.2
user-agent: Pinterestbot
disallow: /
user-agent: Pinterestbot
disallow: /directory1/
user-agent: Pinterestbot
disallow: /directory1/
allow: /directory1/subdirectory1/
user-agent: Pinterestbot
disallow: /directory1/
allow: /directory1/subdirectory1/
crawl-delay: 0.2