2005-05-21
検索エンジンアルゴリズム - 第3要因を探る
Googleでは、アルゴリズムの変更をともなうUpdate Bourbonが進行中であるが、もしやと思って調査してみた。
なおアルゴリズムとは、順位付けのルールであり、それぞれの検索エンジンの仕様に基づき、プログラミングによって実装されているものである。
検索エンジンのアルゴリズム
検索エンジンのアルゴリズムには、下記の2つのポイントで対策するように、一般のSEO関連のサイトや本で語られている。
- ページ内要因:該当ページでのキーワード記述
- ページ外要因:該当ページに向けたリンク
リンクを評価するアルゴリズム
(2)については、SEO塾のミッションではキーワードを含むテキスト以外のリンクを除外しているが、検索エンジンの側でも、該当ページへのリンクでは納まらない独自のリンク評価をアルゴリズムに採用している。
GoogleのPageRankは、量的質的にリンクを受けることである。通説では、トピック(キーワード)に関連のないリンクでも評価されるとなっている。
もうひとつはアンカーテキストマッチであり、誤解を恐れず言い切れば、他ページのアンカーテキストのキーワード記述を自ページのものとすることができる。
Yahoo!(YST)
Yahoo!(YST)のハブ・オーソリティでは、特定のトピック(キーワード)の権威あるリンク集(ハブ)が設定され、そこからのリンクによって他の一般ページが評価され、そのリンク量=オーソリティ度によって上位下位が決定されるということである。
詳細は、HITS(Hyperlink-Induced Topic Search)の疑問をリストアップを参照のこと。
MSN
新MSNでは、リンクが書かれている位置が問題となる。
詳細は、VIPS - 新MSNサーチのアルゴリズムを参照のこと。
Ask Jeeves(Teoma
Ask Jeeves(Teoma)のサブジェクト・スペシフィック・ポピュラリティでは、YSTと同様のハブ・オーソリティがベースにあり、トピック(キーワード)の関連性によるページ群をクラスタ化して、このクラスタ内でのリンク構造によってページの表示を序列付けしている。
よって、トピック(キーワード)に関係のないリンクは評価されず、またSERPsにも関連性が薄いページは表示されない。おそらく、最もキーワード検索で精度が高い検索エンジンとなっている。
詳細は、Ask Jeeves日本語版とそのアルゴリズムなどを参照のこと。
SERPs(検索結果)にまぎれる不審なページ
結論から言うと、YSTやAskのハブ・オーソリティでは、ハブ対オーソリティでは順位はどうなるかということと、このアルゴリズムとは無縁のはずのGoogleでも、何らかの権威的ページの上位表示が見られるということである。
「Yahoo! アルゴリズム」のケース
例えば、「Yahoo! アルゴリズム」をGoogle、Yahoo!(YST)、新MSN、Ask Jeevesでキーワード検索してみる。
- Google 検索: Yahoo! アルゴリズム
- Yahoo!検索 - Yahoo! アルゴリズム
- MSN サーチ : Yahoo! アルゴリズム
- Ask.jp : "Yahoo! アルゴリズム" Search results.
問題は、下記のページがSERPsに現れることである。
(1)と(2)は、Yahoo! JAPANのディレクトリ=カテゴリのページであり、ハブ・オーソリティのハブページである。
Googleでは、(1)が3番目(2)が4番目に表示される。
Yahoo! JAPANのページ検索では、(1)が19番目に表示される。
新MSNでは、当然(1)(2)とも表示されない。
Ask Jeevesでは、(2)が10番目に表示される。
新MSNでは、アルゴリズムとして(1)(2)は表示されず、そして問題はGoogleでかなり上位に表示されるという現実である。PageRankがどうのとか、与太を飛ばさないように。
「ロボット、スパイダー」のケース
もうひとつ、「ロボット、スパイダー」をキーワード検索してみる。
- Google 検索: ロボット、スパイダー
- Yahoo!検索 - ロボット、スパイダー
- MSN サーチ : ロボット、スパイダー
- Ask.jp : "ロボット、スパイダー" Search results.
そして、問題のページは下記。
Googleでは、1ページ目に表示される。
Yahoo! JAPANのページ検索では、3ページ目に表示される。
新MSNでは、問題のページへのリンクがあるページが、4ページ目に表示されている。
Ask Jeevesでは、1ページ目に表示される。
不審なページのアルゴリズム~第3要因
優良と判断されたリンク集ページにこちらのサイトが登録されている場合、こちらのサイトよりもリンク集ページが上位になる方が自然となりかねない。
ハブ対オーソリティでは、ハブが有利。これが、ハブ・アンド・オーソリティの第3要因である。
また、GoogleでもAskと同じような傾向を見せており、トピック(キーワード)における専門性が高くて信頼のおけるページをランキングに加味しているフシがある。
Googleが商標登録したTrustRank TrustSearch - Google Newsの順位付けアルゴリズム
Googleに認められたシード(seed)ページが上位表示される、またシードページからリンクされないと上位表示されない。これがGoogleアルゴリズムの第3要因である。
Florida以降エキスパートというコンセプトが噂になっていたのだが、Update Bourbonでは、「トラスト」としてのシードページや、シードページからのリンクとしての「トラストリンク」ということが一層明確になってきたのだろう。
やはり闇では、ランキングのアルゴリズムは、PageRankからTrustRankに移行しているのかもしれない。
2005-05-21 10:11 AM



