この記事の内容
  • Pinterest クローラーがあなたのサイトにアクセスする理由
  • Pinterest クローラーがあなたのサイトにアクセスする方法
  • Pinterest クローラーを確認する
  • Pinterest クローラーのアクセスを制限する
  • ユーザーが自分のテイストに合うアイデアを見つけて試せるように、Pinterest は何十億ものピンが含まれるデータベースを構築しています。また、できるだけ安全で質の良いコンテンツを利用してもらえるよう、Pinterest はウェブクローラーを使ってページにあるピンの詳細データをチェックしています。

    このようなページから得られる多くのシグナルを読み取って、Pinterest はユーザーの好みに合うおすすめをしたり、スパム対策をしたり、役立つ情報を表示したりできるのです。このようなシグナルをフル活用するために、Pinterest ではピンに関連付けられているページのコンテンツを定期的に取得、保存、処理しています。​

    Pinterest クローラーがあなたのサイトにアクセスする理由

    Pinterest クローラーは主に 3 つの理由で、あなたのサイトにアクセスします。

  • カタログから各商品の画像ファイルをダウンロードする
  • 商品の価格、説明文、在庫状況などのリッチメタデータを収集する
  • ユーザーが安全にアクセスできることを確認する
  • Pinterest クローラーがあなたのサイトにアクセスする方法

    Pinterest クローラーは、あなたのウェブサイトを巡回する際、有効な Pinterest User-Agent を送信し、Pinterest が管理するネットワークからサイトに接続します。

    Pinterest クローラーは robots.txt の Robots Exclusion Standard(ロボット排除規約)を尊重するほか、あなたのサイトにおける同時リクエスト数を制限するように設定されています。クローラーが使用するアドレスは通告なく変更する可能性がありますので、サイト設定で IP アドレスを指定しないでください。

    Pinterest のユーザーエージェントは次のとおりです。

    Pinterest/0.2(+https://www.pinterest.com/bot.html)
    Mozilla/5.0(互換:Pinterestbot/1.0、+https://www.pinterest.com/bot.html)
    Mozilla/5.0(Linux; Android 6.0.1、Nexus 5X Build/MMB29P)AppleWebKit/537.36(KHTML - 例 Gecko)Chrome/41.0.2272.96 Mobile Safari/537.36(互換:Pinterestbot/1.0、+https://www.pinterest.com/bot.html)

    Pinterest は動的な IP アドレスを使用していますが、常に 54.236.1.001 から 54.236.1.255 の範囲になります。

    地域別のクローリング

    Pinterest クローラーは主に米国の IP アドレスのクローリングをしています。ローカライズされたデータをサポートするために、米国以外の IP アドレスをクローリングする場合もあります。

    米国の IP アドレスは 54.236.1.XXX の範囲になります。

    米国以外の IP アドレスには固定された範囲はありません。Pinterest クローラーを装って他のユーザーがあなたのサイトにアクセスしている懸念がある場合、IP 範囲のチェックではなく、次のセクションにある手順に従って、クローラーの信頼性を確認してください。

    Pinterest クローラーを確認する
  • host コマンドを使用して、ログに記録された IP アドレスから DNS 逆引きを実行します
  • レスポンスのドメイン名の末尾が pinterest.com または pinterestcrawler.com であることを確認します
  • 再度 host コマンドを使用して、手順 1 で逆引きしたレスポンスに対し DNS 正引きを実行します
  • レスポンスが手順 1 で入力した IP アドレスと同一であることを確認します
  • 有効な Pinterest User-Agent を送信しているクライアントから一定量のトラフィックを受信しているにもかかわらず上記の DNS テストで正しいレスポンスが返らない場合にはお問い合わせください

    Pinterest クローラーのアクセスを制限する

    Pinterest クローラーの動作を制御するには、あなたのサイトの robots.txt ファイルを更新する必要があります。サブドメインへの robots.txt 配置には対応していないため、robots.txt ファイルは必ずメインドメインに置いてください。

    クローラーの遅延を大きく設定すると、Pinterest のコンテンツの配信とおすすめに影響を及ぼします。従って、遅延は最大 1 に設定され、それ以上の値もすべて 1 として扱います。クローラーの遅延を 1 より大きく設定したい場合は、お問い合わせください

    user-agent: Pinterestbot
    Crawl-delay: 0.2
    user-agent: Pinterestbot
    disallow: /
    user-agent: Pinterestbot
    disallow: /directory1/
    user-agent: Pinterestbot
    disallow: /directory1/
    allow: /directory1/subdirectory1/
    user-agent: Pinterestbot
    disallow: /directory1/
    allow: /directory1/subdirectory1/
    crawl-delay: 0.2
    End of Other articles Links
    ヘルプが必要ですか? お問い合わせはこちら
    User feedback
    この記事は役に立ちましたか?

    collection_fields

    より良い記事を作成するために、ご意見をお聞かせください。