Pinterest 編目程式

為了協助使用者探索喜愛的內容、從事喜愛的活動,我們建立了一個包含數十億個 Pinterest 釘圖的資料庫。為了保護我們的使用者以及提供最高品質的內容,我們使用網路編目程式來協助識別釘圖來源頁面上的資料。

這些頁面包含豐富的訊號,使我們得以推斷更優質的建議、打擊垃圾訊息以及顯示實用的資訊。為了充分運用這些訊號,我們會定期擷取、儲存和處理與釘圖相關聯的頁面內容。

Pinterest 存取您網站的方式

當真正的 Pinterest 編目程式造訪您的網站時,會傳送一個有效的 Pinterest 使用者代理程式,然後從 Pinterest 營運的網路進行連線。

Pinterest 探勘程式遵循機器人排除標準 (Robots Exclusion Standard,robots.txt),設為限制對您網站發出同時要求的速率。請勿在網站組態中對這些網路的 IP 位址進行硬式編碼,因為編目程式使用的位址可能會變更且不另行通知。

Pinterest 的使用者代理程式為:

Pinterest/0.2 (+https://www.pinterest.com/bot.html)
Mozilla/5.0(相容;Pinterestbot/1.0;+https://www.pinterest.com/bot.html)
Mozilla/5.0(Linux; Android 6.0.1;Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML,例如 Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (相容;Pinterestbot/1.0;+https://www.pinterest.com/bot.html)

Pinterest 的 IP 為動態 IP,會經常變動,不過會一律維持在以下範圍內:54.236.1.XXX。

驗證 Pinterest 編目程式

  1. 使用主機命令對您記錄中的 IP 位址執行反向 DNS 查詢
  2. 確認回應中的網域名稱結尾是 pinterest.com
  3. 使用主機命令對步驟 1 擷取的回應執行正向 DNS 查詢
  4. 確認與步驟 1 的 IP 位址相同

如果傳送有效 Pinterest 使用者代理程式的用戶端穩定發送一致的流量給您,但沒有通過上述 DNS 測試,請聯絡我們

禁止或限制 Pinterest 存取您的網站

若要修改 Pinterest 編目程式的行為,您需要更新自己網站的 robots.txt。請確保將 robots.txt 檔案放置在您的主要網域,因為我們不支援子網域的 robots.txt 檔案。

較大的探勘延遲會影響您內容在 Pinterest 上的投放和推薦。因此我們會接受最高達 1 的延遲,任何超過 1 的數值都會被視為 1。如果您清楚我們的做法,但仍需要較大的探勘延遲,請聯絡我們

How Pinterest accesses your site

When a genuine Pinterest crawler visits your website, it will send a valid Pinterest User-Agent and connect from a network operated by Pinterest.

Pinterest crawler respects the Robots Exclusion Standard (robots.txt) and is configured to rate limit concurrent requests made to your site. Don't hard code these network's IP addresses in your site configuration, because the addresses that the crawler uses can change without notice.

Pinterest's user agent is:

Pinterest/0.2 (+https://www.pinterest.com/bot.html)
Mozilla/5.0 (compatible; Pinterestbot/1.0; +https://www.pinterest.com/bot.html)
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Pinterestbot/1.0; +https://www.pinterest.com/bot.html)

Pinterest's IP is dynamic and and changes frequently, but will always be in the range of: 54.236.1.XXX.

Verify the Pinterest crawler

  1. Use the host command to run a reverse DNS lookup on the IP address from your logs
  2. Verify that the domain name in the response ends with pinterest.com
  3. Use the host command to run a forward DNS lookup on the response retrieved from step 1
  4. Verify that it is the same as the IP address from step 1

If you receive a consistent volume of traffic from a client sending a valid Pinterest user-agent but it does not pass the above DNS test, please contact us.

Restrict or limit Pinterest from accessing your site

To modify the behavior of the Pinterest crawler, you'll need to update your site's robots.txt file. Make sure to place the robots.txt file on your main domain, because we do not support robots.txt files on subdomains.

Large crawl delays impact the distribution and recommendation of your content on Pinterest. Therefore, we honor delays of up to 1 and will treat any larger values as 1.  If you acknowledge this and still need a larger crawl delay, contact us.

仍需要協助?
請與我們聯繫