為協助大家探索喜愛的內容、從事喜歡的活動,Pinterest 使用者已建立出擁有數十億個 Pinterest Pin 的資料庫。我們使用網路爬蟲程式來協助識別 Pin 所在頁面的資料,來保護 Pinterest 使用者及提供最高品質的內容。為了協助 Pinterest 使用者對靈感內容採取行動,我們也會探勘建立可購買的產品 Pin,然後對應回商家網站。 這可協助商家在不費力的情況下,提高這些網站的自然傳播流量、銷售成效和轉換率。
Pin 的所在頁面含有眾多資訊性訊號,使我們得以推斷出更優質的建議、阻擋垃圾訊息,以及顯示實用的資訊。為了充分運用這些訊號,我們會定期擷取、儲存和處理與 Pin 相關的頁面內容。
Pinterest 編目程式存取您的網站主要有三個原因:
真正的 Pinterest 編目程式造訪您的網站時,會傳送一個有效的 Pinterest 使用者代理程式,從 Pinterest 營運的網路與該網站連線。
Pinterest 編目程式會遵循「機器人排除標準」(Robots Exclusion Standard,robots.txt),設有對您網站同時發出要求的速率限制。請勿在網站設定中對這些 IP 位址執行硬式編碼作業,因為編目程式使用的位址可能在未通知的情況下有所變更。
我們的使用者代理程式為:
Pinterest/0.2 (+https://www.pinterest.com/bot.html)
Mozilla/5.0(相容;Pinterestbot/1.0;+https://www.pinterest.com/bot.html)
Mozilla/5.0(Linux; Android 6.0.1;Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML,例如 Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (相容;Pinterestbot/1.0;+https://www.pinterest.com/bot.html)
我們的 IP 為動態 IP,而且經常變動,但一律在 54.236.1.001 到 54.236.1.255 之間。
Pinterest 編目程式主要使用美國的 IP 位址來抓取內容,另外也可能使用美國境外的 IP 位址執行這項作業,以支援本地化資料。
美國 IP 位址侷限於以下範圍內:54.236.1.XXX。
非美國 IP 位址則沒有固定範圍。如果您擔心使用者冒用 Pinterest 編目程式存取您的網站,請按照下一個版面的步驟驗證網站的真實性,而非依據 IP 範圍檢查。
如果傳送有效 Pinterest 使用者代理程式的用戶端穩定發送一致的流量給您,但流量並未通過上述 DNS 測試,請
若要修改 Pinterest 編目程式的行為,您需要更新自己網站的 robots.txt。請確保將 robots.txt 檔案放置在您的主要網域,因為我們不支援子網域的 robots.txt 檔案。
嚴重的抓取延遲事件會影響您的內容在 Pinterest 上投放和推薦的情形,因此系統可接受最高達 1 的延遲,任何超過 1 的數值會一律視為 1。如果您需使用更大的抓取延遲數值,請
user-agent: Pinterestbot
Crawl-delay: 0.2
user-agent: Pinterestbot
disallow: /
user-agent: Pinterestbot
disallow: /directory1/
user-agent: Pinterestbot
disallow: /directory1/
allow: /directory1/subdirectory1/
user-agent: Pinterestbot
disallow: /directory1/
allow: /directory1/subdirectory1/
crawl-delay: 0.2