WordPress個別サポート

自分のサイトが丸ごとコピーされた!

しかもリアルタイムで記事が反映されている!

そんな冗談のような現実を目にしたら、どう思いますか?
自分のサイトがコピーされたら

普通に考えれば「うそー」「マジ?!」「コピーされた?!」かもしれませんが、どうやってサイトを丸ごとコピーできるのでしょうか。

もちろん、面識のない第三者によるコピーでFTPのパスワードも盗まれていないとします。

そんなことが可能なのでしょうか?

可能なのです。実際に私のような無名なサイトでも「丸ごとコピー」をやられてしました。。。もちろん、FTPのパスワードなどは一切漏れていません。

ではなぜ?

疑問に思う方もいるかもしれないので、以下、参考になるように「本当にあった怖い話」ではありませんが、「サイト丸ごとコピー」の顛末記を記します。

スポンサーリンク

WordPressテーマ「LOTUS (TCD039)」

なぜ、サイトをリアルタイムでコピーできたのか?

まず、サイトを丸ごとコピーされる方法として考えられるのはWebサイト巡回ツールです。

全ページを収集してFTPでアップロードする方法ですが、私の場合はアクセスログに怪しい巡回記録はありませんでした。

それに、この方法ではないと気づいたのは「リアルタイム」だったからです。

一生懸命にサイトを巡回してFTPする手法ならせいぜい、昨日アップした記事が最新記事に見えているのが限界でしょう。

ところが、そのコピーサイトには、さっき投稿したばかりの記事が早速反映されていたのです!

まさに「リアルタイムミラーリング」と言っても良いでしょう。

その手際の良さには感動すら覚え、サイト運営の参考にさせてほしいと思ったくらいですが、それはともかく、なぜ「リアルタイム」でコピーできたのか、半日くらい脳みそをフル回転させる必要がありました。

「変なプログラムを埋め込まれた?」「Linuxコマンドでミラーリングされている?」など、現実と妄想のミラーリング手法を精一杯イメージしてみましたが、よくわかりません。

レンタルサーバーに問い合わせてもこちらのサーバーに異常な動きや変なプログラムを埋め込まれた形跡もないので、そのような「ミラーリングコマンド実行系」の手法でもなさそうです。

では、なぜ?

しばらく考えて、ピンときたのは、、、

サイトをプログラムで読み込んで出力すれば良いのでは?

ということです。他人のサイトをコピーするのに「・・・すれば良いのでは?」も何もありませんが。

実際、私のサイト「http://www.nishi2002.com/」がコピーされたという想定で同じサイトをローカル環境に再現してみましょう。

以下は正規のホームページ(http://www.nishi2002.com/)です。

正規のホームページ

正規のホームページ

以下は正規のホームページをローカル環境に再現したものです。

ローカル環境に再現したホームページ

ローカル環境に再現したホームページ

正規のホームページの更新がすぐに反映される「リアルタイムミラーリング」が完成です。検証実験するときは、他人のドメインを使わないように注意してください。

大変そうに見えますが、この「リアルタイムミラーリング」のために書いたのは、たった1行のプログラムです。

具体的な手口は紹介しませんが、「そのアドレスを読み込んで出力する」という、プログラミング初心者でも記述できるレベルのプログラムです。

このサンプルはトップページのみを再現しているので1行だけのプログラムですが、もう少し気の利いたプログラムを書けばサイト全体を再現できるはずです。詳しいことは説明しませんが。

このような数行程度のプログラムを好きなドメインにアップロードすれば、狙ったサイトを好きなアドレスに「リアルタイムミラーリング」できるということです。怖いですねー。

そもそも、なぜ「リアルタイムミラーリング」に気づいたか

自分のサイトが別のドメインに丸ごとコピーされたり、このような「リアルタイムミラーリング」されていても、すぐには気づかないかもしれません。

それが怖いのは、盗用したサイトの方が検索エンジンにインデックスされてしまうことです。実際に私のサイトも見知らぬドメインでヒットしてしまいました。。。

おそらくアクセスログを見ていても「サイトAを読み込んで出力」のような新種の(?)パクリ手法の痕跡は記録されないはずです。なぜなら、まったく見知らぬサイトだから。自分のサイトのアクセスログには記録されませんよね。

では、なぜ気づいたか?それは「あるログ」に不自然なドメインが記録されていたからです。悪人にヒントを与えるので具体的には書かないことにしますが、みなさんがよく使っているツールで「ドメイン」(サイト)を確認できるものがあります。

私がリアルタイムミラーリングに気づいたのは、そのツールに見知らぬドメインがリストされていたからです。「このドメイン、何?」ということで調べていったら、自分のサイトが丸ごとリアルタイムミラーリングされていたのを確認できたのです。良かった良かった。良くありませんが。

どうやってリアルタイムミラーリングを防いだか

さて、問題はミラーリングをどうやって止めるかです。

正規の方法で言えばドメインの所有者に「止めてください!」と言えば良いのですが、whoisで確認したら日本語圏ではないのであきらめました。今すぐ停止したかったので。

そこでgoogleに「盗用されているので相手のサイトをインデックスから消してください」と依頼しましたが「盗用されている証明をしてください」と言われて頓挫しました。

どちらが本物か証明しなさいということでしょうか。ごもっともですよね。細部に至るまで完全に一致しているんですから、外から見たらどちらが偽物なのか判断できませんよね。

もっと良い方法はないか?しばらく考えていたら天のお告げ(?)で「.htaccess」というキーワードが。

そうか!

この手法のリアルタイムミラーリングを防ぐのは単純、、、

.htaccessに「deny from 相手のドメイン名」と書くだけでした。

試しに書いてみて相手のサイトにアクセスすると、見事「403 Forbidden」。コピーサイトは消え去りました。一件落着です。。。

しかし、こんなことやっている人、何人いるんでしょうか。有名サイトでもないのに。。。

「リアルタイムミラーリングを防ぐのにdeny fromを使いましょう」なんて、セキュリティ対策の本でも読んだ記憶がないんですがねー。

でも、こんなことが実際に起きるんですねー。同じことで困っている方は参考にしてください。まあ、いないと思いますが。。。

これで、本当にあったウソのようなリアルタイムミラーリングの話を終わります。

あ、書き忘れたので書いておきますが、今回の手口は正確にはミラーリングではありません。あくまで括弧付の“ミラーリング”であって何も「コピー」はしていませんが、外から見るとリアルタイムでコピーされたように動作するプログラムが動いているということです。

しかも、そんなプログラムに上級テクニックは必要なく、基本的な命令を組み合わせていけば初心者でも作れてしまうのです。。。そんな講座を開催、、、しません!

みなさんもご注意ください。

あと、くれぐれもマネをしないように!まあ、具体的な手口を書いてないので大丈夫だと思いますが。

この記事をSNSで共有する
WordPressでお困りのときはご相談を
この記事を書いた西沢直木が直接、WordPress個別サポートで対応します。
こんなときはご相談を
  • WordPressの使い方(ページやメニューの作り方を教えてほしい)
  • カスタマイズ(機能の追加やデザイン調整をお願いしたい)
  • トラブル対応(画面真っ白・「ログインできない」を解決したい)
マンツーマンなので相談内容は自由です。いただいた課題をその場で解決、CSSやPHPも目の前で修正します。気軽にご相談ください。
WordPress講座の問い合わせ先

関連記事

BizVektorのカスタマイズ

WordPressカスタマイズ

WordPressプラグイン

スポンサーリンク
西沢直木によるWordPress講座の紹介
ホームページ作成講座WordPress個別サポート