2005/10/26
googleにインデックスされたようなので結果を調べてみてみました。
結論から言うとどうやら「path_info整形をしてURLに?や&などの引数が含まれない場合でも静的HTMLには敵わない」でした。
以下に対象のsite:ドメイン内のURLに含まれる全ての単語単位の英文字(securityworm,hp,infoseek,co,jp,cgi,bin,path,info,html)
の掲載位置(順位)の違いを2つの比較対象で比べて表にしてみました。
2005/10/26:実験結果【securityworm.hp.infoseek.co.jp での掲載位置】(件数が表記していないものは 25 件中) | ||
\ 比較対照ファイル −−−−−−−− site:ドメイン検索単語 \ | cgi.html (純度100%静的拡張子HTML) http://securityworm.hp.infoseek.co.jp/ cgi-bin/path_info_cgi.html | .cgi/html/ (パスインフォ整形) http://securityworm.hp.infoseek.co.jp/ cgi-bin/path_info.cgi/html/ |
securityworm | 3 | 4 |
hp | 8 | 10 |
infoseek | 4 | 5 |
co | 11 | 14 |
jp | 20 | 24 |
bin(23 件中) | 1 | 5 |
path(2 件中) | 1 | 2 |
info(2 件中) | 1 | 2 |
cgi(25 件中) | 1 | 2 |
html(14 件中) | 2 | 1 |
上の結果からの考察のまえに述べておきたいのですが、【path,info,cgi,html】この4つについてはそれぞれの比較対象のタイトルタグに該当単語が含まれてしまっており、実験結果として掲載位置の差異がでないことは当たり前なので、考察範囲ではなく、あくまで参考です。
で、これを踏まえて除外し改めて表内ピンク色の欄で考察すると、bin,co,jpでのそれぞれの比較対象の掲載順位の差が他の単語での検索結果と比較して若干離れていることがわかります。ではjpとcoとbinに共通する条件とは一体何なのでしょうか。あくまで仮定ですが、これら3つの単語はWEB全体でのヒット件数が2億件を超えており、googleにおいては、こういった莫大なインデックス数を誇る単語に関しては掲載位置の影響がでやすいのではないかということです。
逆に1千万件に満たないinfoseekという英単語、400件に満たないsecuritywormという英単語では掲載位置の差異が現われないことが伺えます。つまりcgiでpath_infoによる整形をし掲載位置について静的HTMLと比べる場合、1千万件以内の単語ではHTMLとはそれほど差異はないが、1億件以上となると差が目立つことがわかります。googleという検索エンジンは権威主義の検索エンジンで、関連語の掲載位置を権威として雪崩式に目的の掲載位置を決定することが見受けられます。ですのでpath_info整形したURLの不利な条件が静的HTMLより少しでもあるのならば、場合によっては掲載位置の障害ともなりえるのではないかといことが結論付けられます。
まとめ:現状では25件中何位か?と、かなり不確定的な条件での比較なので、もっと件数を増やした状態での比較を以後行ってみようと思います。もしかしたら何か変化があるかもしれませんので。2005/10/26
2006/01/11
おおよそ3ヶ月近く経ってインデックスが500件に達したところで同様の観測をしてみました。
すると、なんと比較対象の掲載位置の差異は完全になくなっていたので報告させていただきます。
結論から言うとどうやら「path_info整形をしてURLに?や&などの引数が含まれない場合なら静的HTMLと同じ扱い」でした。
ということは10/26の比較結果は全て信憑性のない不確定な条件下での考察となります。(能書き垂れてますが全く関係ありませんでした。また10月の観測直のちょうど同時期に、UPDATE JAGGERによるgoogleのUPDATEもありましたので不明瞭な部分もあります)
上記記事を今までに閲覧してしまった方、申し訳ありませんんでした。m(_ _)m
2006/01/11:実験結果【securityworm.hp.infoseek.co.jp での掲載位置】(500 件中) | ||
\ 比較対照ファイル −−−−−−−− site:ドメイン検索単語 \ | cgi.html (純度100%静的拡張子HTML) http://securityworm.hp.infoseek.co.jp/ cgi-bin/path_info_cgi.html | .cgi/html/ (パスインフォ整形) http://securityworm.hp.infoseek.co.jp/ cgi-bin/path_info.cgi/html/ |
securityworm | 151 | 150 |
hp | 349 | 348 |
infoseek | 168 | 167 |
co | 318 | 317 |
jp | 473 | 472 |
bin(292 件中) | 159 | 158 |
ということでpath_infoのURLは見た目はかっこ悪いですが、大手掲示板群サイトがpath_infoを採用して、ちゃんと検索でHITしているところをみると、動的URL対策として.htaccessによるURLの完全な静的化整形できる環境が絶対条件かというとちょっと疑問に感じはじめた今日この頃です。
以上で実験を終わらせていただきます。どうでしょう?