忍者ブログ
使い方が分からないのでとりあえずいじくってみる為の場所・・・だったんだが、好き勝手に萌え語りをする場所に成り下がっている。
Admin | Write | Comment
にくきゅうv
ポインターで弄って下さい(*´д`*)
いつも貴方ににくきゅうをv
一言ありましたら・・・
カテゴリー
アーカイブ
カウンター
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


検索避けについてつらつらと書こうと思います。
私もあまり詳しくはないので、間違っている事があるかもしれません。

興味のある方のみお読みください。

 

私はあっちの二次創作サイトは立ち上げ当時から検索避けしていました。やはり二次創作を全く知らない方がいきなり読んじゃうとショックが強いだろうと思いまして。
それにキャッシュなどにいっぺん拾われちゃうと消すのが大変だからです。

その時から入れてたのが


<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW" />
<META NAME="ROBOTS" CONTENT="NOARCHIVE,NOINDEX,NOFOLLOW" />


の二つですね。
上はグーグルのロボット避けで、下は検索ロボット全般の検索避けといわれています。
最後の /(スラッシュ)はブログのテンプレートの他のメタタグが/で終わっていたらつけた方がいいと書いてあったのでつけたんですが、効果は変わりがないと思います。
(どっちでも拾われなかったので)


この二つの効果はあると思います。
googleやyahooにはサイトアドレスなどで検索しても出てきませんでしたから。

Aテキストサーチさんは拾っちゃうんですが、テキストサーチから来て下さる方はサイト内容を知った上で来て下さっているのでむしろ大歓迎ですv


その後数ヶ月後にとある掲示板で知ったメタタグを取り入れました。


<meta http-equiv="Pragma" content="no-cache" />
<meta http-equiv="Cache-Control" content="no-cache" />
<meta http-equiv="Expires" content="0" />


これなんですが、「検索サーチにキャッシュを乗せる時間を0にしてね」つまりキャッシュを載せないで下さいとお願いするメタタグだそうです。
効果は・・・わかりません(笑) グーグルなどに拾われたことが無かったので、効果を試す機会はありませんでしたから。

 

これですっかり安心していたのですが、興味本位で「百度」という大手サーチでサイト名検索をかけてみたらばっちり出ちゃいました。
(それも上から2番目のところに『Birth』が! …あんなキワモノSSがぁぁ)orz

 


百度についていろいろ調べてみたのですが、実に悪名高かったです。
まず普通のメタタグによる検索避けは役に立たないそうです。
そして一度百度に拾われたら、たとえサイトを閉鎖してもキャッシュは延々と消えないようです。

『「BaiduChecker」は、すでに存在しないサーバやウェブページを検出するプログラムです。』と公式サイトにもありますから。

キャッシュ削除に申し込んで一度消えても、数ヶ月後にまたキャッシュが復活したという管理人さんもいらっしゃいましたしね。


robots.txt なら検索拒否設定ができると書いてあるんですが、ブログでは無理ですから(笑)

んで公式サイトにあった通りに


<meta name="baiduspider" content="noindex, nofollow">
<meta name="baiduspider" content="none">
<meta name="baiduspider" content="nofollow" >


のメタタグを入れてみました。

結果・・・・・・しっかりと拾われてました(苦笑) 昨日の事です。


まあ、webでブログサイトを開いている以上は仕方がない事なのでしょう。
そう思うことにします。
百度から御出でになっている方は今の所そうはいらっしゃいませんしね。

百度はエロ画像検索で有名な所なので、きっと二次創作に耐性のある方でしょう。
好みに合わなかったらそっとスルーして下さると信じます。


ああ神様、どうか猫のブリーダーさんを探してたどり着いたりする方が居ませんように!

 

百度避けのrobots.txtの書き方をお知りになりたい方は、「百度」で検索して
百度Topページから「お問い合わせ」→「検索全般について」→「利用環境について」→「サイト管理者向け」に行くと書き方が載っています。御参考までに。

 
※追伸

その後・・・ブログのRSSが発信できないようにして、ついでにアクセス制限入れてみました。
・・・・・・結果、やっぱり拾われてる。 しかもアク解に載ってない・・・(分からないだけかも)orz
ちなみにrobots.txt入れても拾われてるサイトさんは多いそうです。
IPで制限しても次から次へと新しいIPを入れてくるのでいたちごっこみたいです。
キャッシュを消すのに成功したというサイトさんにはお目にかかったことがありません。

ああ・・・・・・もういいや。

PR
<< BACK  | HOME |   NEXT >>
Copyright ©  -- Mackerel Tabby --  All Rights Reserved
Designed by CriCri / Material by White Board
忍者ブログ  /  [PR]