HackerNews

ボットに餌を与えよう

Feed the bots

https://maurycyz.com/misc/the_cost_of_trash/


この記事では、ボットがウェブサイトに与える影響とそれに対する対策について述べられています。著者は、無限のナンセンスクローラーを設置した結果、サーバートラフィックの99%がボットから来ていることを発見しました。これらのボットは、もはや古いインデクシングボットではなく、AIモデルをトレーニングするためのデータを収集するスクレイピングボットです。著者は、IPアドレスをブロックしたり、ユーザーエージェントを偽装されたりするなどしても、ボットに困難を与えることが難しいことを説明しています。ボットの活動に対抗するために、単に静的ファイルを提供するコストについても触れています。また、動的コンテンツがボットに対して有効であることや、過去のページを取得するボットの特性についても言及されています。このように、ボットとの戦いは複雑で、常に新しい手法を考え出す必要があることを示しています。