読者です 読者をやめる 読者になる 読者になる

サイトとアプリ運営に関するメモ的なブログ

自分で運営しているブログとかアプリについて書くところ 収益とかSEOがらみが多くなるかも

サイトのコンテンツが丸ごと不正コピーされていたので対応してみた

運営しているサイトのコンテンツが、いつの間にか不正に丸ごとコピーされていたので、諸々対応してみた。

気づいたきっかけ

「Search Console」で「サイトへのリンク」を確認したところ、複数のドメインから、それぞれ数万の被リンクが発生しているのに気がついた。

基本的に被リンクはサイトの検索順位を押し上げる効果があるものなのだけど、この数は明らかにおかしい。

なので該当のサイトを見に行ったところ、悪質な不正コピーサイトだということがわかった。

単に私のサイトのテキストをコピーするだけでなく、CSSもそのまま使われて、見た目もそっくり、というひどさだった。

その上、タイトルが商品名に置き換えられていて、文中にも商品リンクが大量に貼られていたりした。

私のサイトはそれらの商品とは何の関連性もないコンテンツを掲載しているので、商品リンクと組み合わせても機能するとは思えず、えらく雑なスパムサイトだった。

しかし不正コピーを放置するわけにもいかないので、色々と対応をした。

連絡先がわかれば直接警告を送ってもいいのだけど、丸ごとコピーなので記載されていないし、Whoisドメイン情報を調べても「データが取得できません」とか出てしまったので、周辺から攻めることにする。

Googleに検索結果からの削除を依頼した

Googleには著作権法違反をしているサイトに対し、検索結果からの削除を依頼することができるので、まずはそれを実行した。

こちらのページから依頼できる。

https://www.google.com/webmasters/tools/dmca-notice?pli=1&hl=ja

コピーされたページと、コピーして不正に掲載しているページのURLを記載すれば申請できる。

申請から一週間くらいして回答があったが、「あなたが著作権者だと確認できないので対応できない」という内容だった。

「もしも著作権者であるのなら、申請に至った経緯を詳しく教えてください」といったことも記載されていたので、Search Consoleで発見したこと、商品リンクが大量に加えられているので、悪意のある第三者が収益や宣伝目的で不正コピーをしたと見なしている、といった内容を書いて返信をした。

すると翌日に追加の回答があり、「検索結果からの除外を実行しました」という連絡が来た。

なので、申請の経緯を詳しく伝えて、それに信憑性があれば対処する、という方針なのかもしれない。

あと、私のサイトの方に「不正コピーサイトがあるけれども、正当なのはこのドメインのサイトですよ」といった内容の記述を加えておいたので、それを見て申請が正当なものだと判断された可能性もある。

特に確認をせずに対応してくれる場合もあるようなので、このあたりはケースバイケースなのだろう。

削除されたのは一部のページだけだが、全体で数千ページもコピーページが量産されているので、それをいちいち申請するのは現実的ではなく、各ドメインのトップページだけをひとまず申請した。

不正行為を行っている相手への警告になるだろうし。

ないとは思うが、もしもコピーページが検索の上位に来るようなことがあれば、追加で対応するつもりだ。

リンクの否認ツールを使って、被リンクの影響を削除した

Googleは「リンクの否認ツール」というものを用意している。

これを使えば、悪質なサイトからの被リンクを、検索順位を決める際の条件から取り除くことができる。

基本的に、Google側で悪質なサイトを見分けており、そういったサイトからの被リンクは評価しないようなのだけど、もしも誤認されたら嫌なので申請しておいた。

Search Consoleに不正コピーサイトの情報がいつまでも出ているのも不愉快だし。

こちらはツールで自動的に行われるので、メールのやり取りなどは必要ない。

興味のある方は、公式のページで詳細を確認いただきたい。

ツールへのリンクも以下のページに記載されている。

support.google.com

テキストファイルに該当のURLやドメインを記載し、アップロードするだけなので、作業としては簡単だ。

申請から反映までは、数週間がかかるらしい。

.htaccessを使ってアクセスを拒否した

コピーしているドメインからこちらのサイトにアクセスし、データの引き出しを行ったと思われるので、該当のドメインから私のサイトにアクセスできないよう、.htaccessに記載してアクセス拒否を行った。

# アクセス拒否を設定
Order allow,deny
allow from all
deny from 拒否したいドメイン

と記載すれば拒否できる。

これでデータが引き出しにくくなったはずだが、これには抜け道もあるので、どこまで効果があるかは不明だ。

それでも一応はやっておいたほうがいいだろう。

Seach Consoleの登録は重要

ある程度サイトの運営経験がある人なら既にやっているとは思うけど、もしもまだならSeach Consoleには登録しておいたほうがいいと思う。

サイトのキーワードごとの検索順位やクリック数が確認できるし、問題があれば警告が出て確認できたりするので、何かとサイトの運営に役立つツールだ。

(今回のように不正行為の発見もできるし)

それにしても、不正コピーを行う連中は本当に迷惑だが、サイトの運営をする以上、ある程度は対応をせざるを得ないので、他の人の役に立つかもと思ってこの記事を書いた。

連絡先がわかるなら直接警告を送ってサイトを削除させた方がいいのだろうけど、億劫だったり無理な場合もあるだろうし、その時にはひとまず上記のような手段で対応することになると思われる。