こんにちは、河野です。
ブログを運用していると誰しも悩むことが、コメントスパムです。
設定やプラグインでフィルタリングしているので、普段は気になりませんが、たまにフィルタリングをすり抜けて、「あーうっとうしいなぁ」と思うこともあります。
さて、そんなコメントスパムですが、いったいどこからやってくるのでしょうか?気になったので調べてみました。
国別のコメントPOST トップ10
TechscoreBlogのアクセスログのうち、wp-comments-post.phpに対してPOSTしているものを集計してみました。
トップ10は以下のようになりました。
| 1 2 3 4 5 6 7 8 9 10 11 12 |    7023 United States    5021 China     809 Canada     786 France     681 Ukraine     290 Russian Federation     201 Netherlands      79 Germany      59 Japan      45 Luxembourg ==============================   15307 total | 
アメリカと中国がダントツに多いですね。日本からは59件。
全体で15307件だったので、アメリカと中国で78.6%もPOSTされていることになりました。
IPをuniqして確認
先ほどの数字は単純なアクセス数(ログ件数)なので、IPをユニークにして再度集計してみました。
| 1 2 3 4 5 6 7 8 9 10 11 12 |     721 China     280 United States      57 Ukraine      52 France      49 Russian Federation      46 Canada      40 Venezuela      28 Japan      24 Netherlands      24 Indonesia ==============================    1506 total | 
おっと、Chinaが圧倒的に1位ですね。アメリカがぐっと減りましたが、それでも2位です。
あくまでもアクセスログからなので、もしかしたらスパム以外の不正アクセスも含まれていそうですが、何となく思っていた感覚に近いです。
WordPressのコメントから集計
アクセスログには不正なアクセスも含まれそうです。
1年分のコメントは残っていないのですが、WordPressのデータから集計してみました。
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |      35 China      22 Venezuela      18 Japan       7 United States       2 Poland       2 Malaysia       1 United Arab Emirates       1 Ukraine       1 Russian Federation       1 Philippines       1 Latvia       1 Kenya       1 Iran, Islamic Republic of       1 Indonesia       1 Hong Kong       1 Guatemala       1 Greece       1 Germany       1 France       1 Egypt       1 Czech Republic       1 Canada       1 Cameroon       1 Argentina       1  ==============================     136 total | 
WordPress上のデータではやはりChinaが多いと言うことになりました。一方で、アメリカが含まれていません。
またVenezuelaは、IPの件数とコメントの件数が近いです。Chinaからのアクセスはスパム以外も含まれていそうですが、Venezuelaからのアクセスはスパムがほとんどで、精度が高い(WordPressにコメントできてかつスパムと認定されている)のがわかります。
AWS率は?
ちょっと気になったので、AWS率を調べてみました。
AWSのEC2が使用するIPのリストは以下で確認しました。
AWS Developer Forums: Amazon EC2 Public IP Ranges
結果、該当したIPは3件でした。
ユニークなIPが1506件なので、1%にも満たないですね。
まとめ
実際のコメントスパムのデータを見ると、やはり中国からが多かったです。
一方で、wp-comments-post.phpに対してのアクセス数はアメリカが最も多かったので、これはスパムではない何か、おそらくウィルスやボットなどの不正アクセスが多いのかなと思いました。(ここはログを精査した方が良いかもしれません)
Techscoreに関して言うと、国内向けに記事を書いていますので、中国とアメリカからのアクセスを遮断すれば、負荷が下がるのかも知れませんね。

 
						