從21世紀初開始,越來越多人以搜尋引擎作為進入目的網站的路徑,使得搜尋引擎不只是蒐集資料的工具,另外還扮演網路「導航」的重要角色。產生這種變化的最大原因,即是因為Google讓搜尋引擎功能有了跳躍式的進步。
Google採用2種革命性的創新技術,首先是「群集」(clustering)。過去搜尋引擎的資料庫需要以工業電腦來運算,然而網站內容不斷暴增,業者必須時時汰換電腦設備,往往造成龐大的成本。此問題在採用群集技術後便迎刃而解,因它能透過網路串連成千上萬台普通電腦,發揮的效能大過一台超級電腦。
第2項創新技術是鼎鼎有名的「網頁評比」(PageRank,或有人稱「佩吉演算法」),也是Google搜尋軟體工具的核心。何謂PageRank?簡單解釋就是Google為了提供用戶更準確的搜尋結果,需要確保搜尋出來的網頁比其他網頁更重要、更有價值,於是想出一個方法來為網站分級,主要的依據就是1個網頁受到其他網頁連結的次數。舉例而言,當網頁A連結至網頁B時,則視為網頁A投給網頁B一票,得票數越多的網頁,出現在Google搜尋結果的位置就會越前面。時至今日,Google已加入超過1,000項的變因決定PageRank值。
不過隨著部落格的快速發展,許多人意圖操控PageRank值的分數,目前Google也不再單純以PageRank值判定排名的次序。Google 會檢查票數來源,或是連結網頁接收的票數;同時它也會對參與投票的網頁加以分析。
原則上,這種技術透過「重要的」網頁來參與投票,並且幫助其他的網頁也成為「重要的」網頁資料。換言之,其邏輯相信「高人氣網站連結的網站就是好網站」,例如得到雅虎、MSN等大型網站連結的網頁才能獲得高分,Google再依據此分數排列搜尋結果順序,確保真正重要、優質的網站得到較高的PageRank。
Google不出售以PageRank演算出的搜尋排名結果,並標榜自己「不會介入販賣廣告內的任何商品」,因此使用者獲得一個印象:Google的搜尋結果最為準確且客觀,使其一砲而紅。
在Google的刺激下,彈指間就能「秀」出搜尋結果成了一種標竿,其他業者包括雅虎、微軟等也開始傾全力改善既有的搜尋引擎服務,這也促使上網者更加依賴這樣的工具,而讓搜尋引擎得以滲透到全球網路的每一個角落。
本文於 修改第 1 次