Trình thu thập thông tin Pinterest

Để giúp mọi người khám phá và làm những gì họ yêu thích, chúng tôi đang tạo cơ sở dữ liệu với hàng tỷ Ghim trên Pinterest. Để bảo vệ người dùng của chúng tôi và cung cấp nội dung chất lượng cao nhất, chúng tôi sử dụng trình thu thập dữ liệu web để giúp chúng tôi xác định dữ liệu trên các trang phía sau Ghim.

Những trang này có các chỉ báo phong phú cho phép chúng tôi đưa ra những đề xuất hay hơn, chống thư rác và hiển thị thông tin hữu ích. Để tận dụng triệt để những chỉ báo này, chúng tôi thường xuyên lấy về, lưu trữ và xử lý nội dung trang web liên quan đến Ghim.

Cách Pinterest truy cập trang web của bạn

Khi trình thu thập thông tin chính thức của Pinterest truy cập trang web của bạn, nó sẽ gửi xác nhận người dùng Pinterest hợp lệ và kết nối từ mạng do Pinterest vận hành. Ngoài việc tôn trọng Tiêu chuẩn loại trừ robot, trình thu thập thông tin Pinterest được định cấu hình để tự động xếp hạng các yêu cầu đồng thời giới hạn được thực hiện cho trang web của bạn.

Chúng tôi khuyên các quản trị web tránh mã hóa cứng các địa chỉ IP của các mạng này trong cấu hình trang web của họ, vì các địa chỉ mà trình thu thập thông tin sử dụng có thể thay đổi mà không cần thông báo trước.

Tác nhân người dùng của Pinterest là:

Pinterest/0.2 (+https://www.pinterest.com/bot.html)
Mozilla/5.0 (tương thích; Pinterestbot/1.0; +https://www.pinterest.com/bot.html)
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, như Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (tương thích; Pinterestbot/1.0; +https://www.pinterest.com/bot.html)

IP của Pinterest rất linh hoạt và do đó liên tục thay đổi, nhưng sẽ luôn nằm trong phạm vi: 54.236.1.XXX.

Xác minh trình thu thập dữ liệu Pinterest

  1. Sử dụng lệnh máy chủ để chạy tra cứu DNS ngược trên địa chỉ IP từ nhật ký của bạn
  2. Xác minh rằng tên miền trong phản hồi kết thúc bằng pinterest.com
  3. Sử dụng lệnh máy chủ để chạy tra cứu DNS chuyển tiếp trên phản hồi được truy xuất từ bước 1
  4. Xác minh rằng nó giống với địa chỉ IP từ bước 1

Nếu bạn nhận được lưu lượng truy cập đồng nhất từ máy khách gửi Tác nhân người dùng Pinterest hợp lệ nhưng không vượt được qua bài kiểm tra DNS nêu trên, hãy mở thẻ hỗ trợ.

Hạn chế Pinterest truy cập trang web của bạn

Để sửa đổi hành vi của trình thu thập thông tin Pinterest, bạn sẽ cần cập nhật robot.txt của trang web tập tin. Trình thu thập dữ liệu của Pinterest sẽ tuân thủ các chỉ thị sau:

  • Không cho phép
  • Cho phép
  • Thu thập thông tin chậm trễ
     
Bạn vẫn cần trợ giúp?
Liên hệ