スペースモラトリアムノカミサマ

日記+コメント付きブックマーク+他人にも役に立つかもしれない情報など。
(更新情報: RSS(ツッコミ付き) / RSS(ツッコミ抜き) / LIRS)

最近のツッコミ:
  1. Misery (11/06)
  2. p (07/15)
最近の TrackBack:
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|06|07|08|09|10|
2011|01|02|03|07|10|11|
2012|02|03|04|07|08|09|
2013|01|06|07|
2014|02|08|09|11|
2015|09|
2016|01|05|
2017|07|
2018|05|07|
2019|07|

2007/09/17

_ [日記/blog] Referer spam 臭が強い検索サイト

tDiary のリンク元を見ていると、ここ最近見慣れない検索サイト?からのアクセスが急増していることに気がついた。

ざっと眺めていると、ある程度共通点がある。

  • このサイトへのリンクは、ページのメインコンテンツからではなく、「関連エントリー」「ピックアップ・エントリー」等としてページ最後などに小さな枠として表示されている
  • アフィリエイトがページの大半を占めているものが多い
  • 関連エントリーのリンク先が tDiary サイトであることが多い

どうも、検索サイトを装って Anti Referer Spam プラグイン対策を行ったうえで tDiary を狙った spam サイトではないかという疑いがある。

(Anti Referer Spam プラグインの作者の日記でもちょうど spam 対策漏れについて取り上げられていた)

アクセスログに記録されていたものを多い順にざっと整理すると以下のような感じだ。

サイト キャッチコピー アフィリエイト 関連エントリーのリンク先 pmakino.jp アクセスログへの初出 アクセス量 アクセス元 IP の偏り 独断による spam サイト判定
YGブログ検索 Yahooブログ検索とGooブログ検索を同時に表示します。 無し (楽天へのリンクはあり) ほとんど tDiary 2007/6/24 非常に多い 若干ある グレー
入れ⇔替え検索 単語2つで検索してみてください。検索結果の違いを一覧できます。 あり、楽天 全て tDiary 2007/4/12 多い 若干ある グレー
人気商品検索 今話題の人気商品、人気アイテムを探索 もろ Amazon、Yahoo、楽天ほか ほとんど tDiary 2007/6/8 多い 顕著にある
くっつき検索 複数単語で検索する時、間のスペースを削除して検索すると全く違う検索結果になることがあります。スペースを入れた検索結果とスペースを消した検索結果を比較できる検索サイト、それが「くっつき検索」です。 もろ Amazon、Google ほとんど tDiary 2007/6/28 多い 顕著にある
ワード探偵 単語から【説明・関連語・関連ニュース・動画・ブログ・関連商品】情報を調査します。 もろ楽天、Google tDiary か他の spam サイト 2007/7/2 多い 若干ある
ポピュラーワード ポピュラーな話題を探検してみませんか? もろ Amazon tDiary か他の spam サイト 2007/7/20 少ない それなりにある
クラウド・ニュース ニュースサイトの直近の記事を収集し、特徴語抽出を行い、タグクラウド形式で表示します。 もろ楽天 全て tDiary 2007/6/6 少ない 顕著にある
RakuPla 商品数15,000,000点以上の楽天市場から、商品を簡単に検索できます もろ楽天 全て tDiary 2007/5/24 少ない サンプル少なすぎて判断不能
楽天ショッピングサポート キーワードで検索すると、様々な補助機能により楽天ショッピングをサポートします もろ楽天 tDiary が多い 2007/8/6 少ない サンプル少なすぎて判断不能
フュージョン検索 検索エンジンのマッシュアップ あり、楽天 全て tDiary 2007/5/2 少ない サンプル少なすぎて判断不能 グレー
くらべえ 通販ショップ(楽天市場、Yahoo!ショッピング、ビッダーズなど)を一括価格比較 もろ Yahoo!、楽天 ほとんど tDiary 2007/8/25 少ない サンプル少なすぎて判断不能
何でも検索 今。最も瞬なワードの最新情報をお届け あり、Amazon、bidders tDiary が多い 2007/8/16 少ない サンプル少なすぎて判断不能 黒に近いグレー
夢人 あり、Amazon 全て tDiary 2007/7/20 少ない サンプル少なすぎて判断不能 黒に近いグレー
FAQ PAPER 質問検索エンジンです。気になる単語を入力してみてください。あなたの気になる単語について質問を検索します。 無し tDiary の他にも様々 2007/9/18 少ない サンプル少なすぎて判断不能

(他にも *.some-lie.com や *.freeweb.shachihoco.com、*.adultadultadult.net 等、あからさまにアダルトなサイトからも Anti Referer Spam プラグインをすり抜けてきたものがあったが、これは論外である)

個人的に黒だと判断したものは下記のように Apache で弾くことにし、過去のリンク元一覧からも一掃した。

 SetEnvIf Referer "^http://([^/]+\.)?item-word\.com" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?words\.sohjiroh\.info" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?wordtantei\.com" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?pop-wd\.com" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?cloudnews\.net" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?rakupla\.com" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?shopping\.rash\.jp" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?kurabee\.net" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?youtubeyoutubeyoutube\.info" referer_spam
 SetEnvIf Referer "^http://([^/]+\.)?pson-wd\.com" referer_spam
 deny from env=referer_spam

(ちなみに httpd.conf で設定している Referer spam 対策関連の部分を過去設定してきたものも含めてまとめて抜粋するとこんな感じである)

この手のサイトは今後も増えてきそうだ。

(10月10日追記: 同じようなことやってる人発見 → ぱぱネット(仮) - SEOスパムの蛆虫野郎どものリスト)

検索サイトに偽装した Referer spam サイト (2)」に続く。

本日のツッコミ(全2件) [ツッコミを入れる]
_ cyrixn (2007/09/22 09:18)

なんか、大変そうでつなぁ( ̄□ ̄;)!!

_ p (2007/09/24 23:40)

こう手間暇かかるとやっぱりはてなダイアリーとかに移転した方がいいんじゃないかという気がしてきますね…<br>まあ半分楽しんでやってるので面倒ばかりじゃないんですが。