1. 導論
搜尋引擎
I. 搜尋引擎
「Google」的名稱是從「googol」衍生而來,這個字是由美國數學家 Edward Kasner 的侄子 -
Milton Sirotta 所創造。一個 Googol 所代表的數字為 1 後面加上 100 個零。Googol 是一個非常大
的數目, 宇宙中沒有任何事物可以用 Googol 來表示,即使是星辰、微塵粒子或原子也是如此。
Google 沿用此字來對映我們的任務 - 組織世界上無窮無盡的資訊,供全球使用並讓大家從中受
益。
「Google」唸做「goo-gull」 (有點像「noodle」,但是把「n」和「d」換成「g」)。 兩個「o」
的發音與在「moo」和「kangaroo」中相同。
1. 運作模式
��.1三部曲
a. 爬梳
i. 對爬梳器友善
ii. 移除內容
b. 索引
c. 搜尋
��.2排序
a. 評鑑
b. 網頁級別(PageRank)
c. PigeonRank[鴿子排行]
d. 搜尋引擎最佳化專員(SEO)
��.3帳戶(Google Account)
a. 個人資料
b. 服務資訊
i. Google 快訊
ii. Google 網上論壇
iii. 個人化搜尋
iv. Google Answer[懸賞提問]
v. Gmail
vi. Froogle[購物清單]
vii. 個人化的主頁
viii. 使用的語言
ix. 谷 歌視訊上載計劃
x. 文字廣告[AdWord]
xi. Google 新聞
xii. orkut
2. c. 刪除帳戶
��.4Google Alert
��.5Google Sets
��.6Google Suggest
我們通常將美國之外的國家/地區的用戶從 Google.com 重定向到我們面向特定國家/地區的網站
(例如,針對德國的 Google 網站是 www.google.de ),以使用戶可以輕鬆使用面向特定國家/
地區的搜索功能。我們使用您電腦的 IP 位址來確定您的位置以及相應的 Google 域,這一 IP 地
址通常是您的互聯網服務提供商 (ISP) 的互聯網地址。
如果您希望訪問 Google.com 而不進行重定向,請單擊 Google 主頁右下方的"Google.com"鏈
結。
如果您啟用了 cookie,之後每次進行訪問時,您的流覽器都會直接連接到 Google.com。有關
cookie 的詳細資訊,請訪問 http://www.google.com.tw/cookies.html 和
http://www.google.com.tw/privacy.html
如果禁用 cookie,則每次訪問 Google 時,都照樣會進行重定向。啟用 cookie 或為
http://www.google.com/webhp 設置書簽都可以解決這一問題。在後一種情況下,每次在您選擇
該書簽時,都會轉到 http://www.google.com/webhp ,它與 Google.com 完全相同。
最後,如果您認為我們沒有正確地檢測您的 IP 位址,請提供以下資訊。
1. 您的 IP 地址。
如果您不知道自己的 IP 位址,請單擊"開始">"運行"> 鍵入"cmd"> 單擊"確定"> 鍵入"ipconfig">
按 Enter 鍵。您的 IP 地址類似於:217.148.184.7
2. 您的實際位置(例如:法國巴黎)
3. 您被重定向到的 Google 網站(例如,Google.co.in)。
如果問題出在我們這端,我們會在數周內解決這個問題。
1. 三部曲
搜尋引擎的運作模式, 可分為三個程序: 爬梳網頁資訊、索引成資料庫、用戶搜尋。
1a. 爬梳
Googlebot 是 Google 爬梳網頁資訊的工具, 即俗稱的蜘蛛精(spider)的程式, 不捨晝夜地在網路上
爬梳資料, 傳回 Google 的伺服器, 並對每份資料編號, 以備使用者搜尋。
3. Google 可以為大多數的網頁和檔案建立索引, 涵蓋的副檔名有:
pdf、asp、cfm、doc、html、jsp、lwp、php、ppt、rtf、shtml、swf、wks、 wri、xml、xls 等。
Google 的漫遊器會定期檢索網頁,為超過幾十億的網頁產生索引。 在我們很快將完成的下次檢
索後,新網站、現有網站的變更及無效連結均會反應在索引中。因為我們每次檢索時收集大量
資訊,因此更新程序是完全自動化的。 我們無法對個別網站進行手動變更。
我在搜尋結果中找不到我最喜愛的網站。Google 是如何找到網站並將他們添加到檢索中?
Google 是使用 [spiders] 軟體在網路上定期抓取網站的全自動搜尋引擎。它通過每個網頁的超連
結找到網站並添加到我們的檢索中。如果您想更進一步瞭解關於 Google 搜索的技術資訊,請您
查看
http://www.google.com/intl/zh-TW/corporate/tech.html
儘管 Google 抓取無以計數的網頁,但是不可避免會漏抓一些網站。如果 Google 沒有抓取到某
網站,那很有可能使因為以下的某個原因:
- 該網站與其他的網頁沒有很好地通過多個連結相連。
- 該網站是在 Google 最近一次抓取完成之後才發佈的。
- 該網站的設計使 Google 難以有效地抓取其內容。
- 該網站在我們嘗試抓取時暫時無法獲得。
請注意,納入 Google 的搜尋結果是免費的,並且我們的抓取過程是全自動的。我們不接受為納
入檢索結果的付費,我們也決不人工操縱搜尋結果。我們深信憑藉網路民主可以確定搜尋結 果
所包括的內容和網頁排序。如想獲得更多關於在索引中針對網站的可行性實踐的資訊,請您造
訪我們的網站管理員指南 http://www.google.com.tw/support/webmasters/bin/answer.py?
answer=35769
有時候 Google 搜尋結果會出現不包含您搜尋字詞或詞組的頁面。 即使您執行詞組搜尋時也可
能發生此情況。 在評估某網頁的價值與相關性時,Google 查看的不只是網頁本身的內容,同時
也會查看連結文字錨點指向的網頁。如果指向網頁的鏈結包含您搜索的片語,Google 可能會將
其視為符合查尋的匹配項而返回此頁。發生这种情況時,我們網頁的快取副本會在左上角的區
域,顯示下列訊息: [這些字詞只出現在指向本網頁的連結]。對多數的搜尋而言 (包含詞組搜
尋),對文字錨點的評估大大地改善了搜尋結果的相關性。
1a1. 對爬梳器友善
對網頁爬梳器友善的網站, 有助於搜尋引擎找到它。
1a1a. 網站設計及網頁內容
設計網站及撰寫網頁時, 應遵照下列的原則, 便於被搜尋引擎找到。
12. 網頁級別的值, 由 0 至 10, 分為 11 個等級。被 Google 爬梳到的網頁, 都有網頁級別。新加入的網
頁, 其網頁級別值都是 0, 只有百來個網頁, 得到網頁級別值的最高值 10, 包括
yahoo.com、adobe.com 等網站所屬的數個網頁; 甚至 Google 本身的首頁, 祗得到網頁級別 10; 臺
灣的 Google 首頁, 得到網頁級別 8; 中國大陸的 Google 首頁, 得到網頁級別 10。
Google 的軟體工具核心是網頁級別), 這個系統是由兩位創辦人賴瑞‧佩吉(Larry Page)和賽吉‧布
林(Sergey Brin)於在史丹佛大學唸博士班時, 研發出來的。
網頁級別如同個別網頁價值的指示器, 透過龐大的連結架構來信賴網站獨特地民主性質。簡單來
說, Google 說明網頁 A 連結至網頁 B 時, 則視為網頁 A 投給網頁 B 一票。當然, Google 會查看票
數來源, 或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參
予投票, 並且幫助其它的網頁也成為「重要的」網頁資料。
重要、優質的網站會得到較高的網頁級別, 同時 Google 會記住每次所處理的查詢情況。當然, 如
果查詢出來的網頁結果並不符合您的需求, 重要的網頁對您也不具任何意義。因此, Google 將網
頁級別和精密的內文比對技術結合, 來找出重要並且與您的查詢相關的網頁。Google 會將出現
於網頁上的字詞顯示出來, 並且檢查所有的網頁內容及連結到此網頁的其他網頁內容以決定這樣
的查詢結果是否最符合您的需求。
網頁級別有三個指標:
��.1被連結數 - 最容易理解的指標
��.2來自優質網頁的被連結 - 有優值的指標
��.3被連結網頁的連結數 - 有意義的指標
第一個指標最容易理解, 被連結次數多等同於受歡迎程度; 來自優質網頁的連結, 其價值較高; 被
連結網頁的連結數在合理範圍內, 表示該網頁的連結是有意義的。
對於線性代數稍有瞭解的人, 不妨深入閱讀參考書目的資料, 一定會喜歡的。
2c. PigeonRank[鴿子排序]
2002 年 4 月 1 日, Google 公佈鴿子排序細節, 它是網頁級別的核心。
有點像是愚人節的把戲, Google 以鴿子的行為比擬為它的搜尋運算。把一大群個人電腦等級的
機器, 比喻為鴿子, 每個電腦找到相關的結果, 就給予一個排序值, 愈多電腦認定該結果是相關, 該
結果的排序值就愈高。
鴿子的行為不受個別鴿子的影響, 眾多個人電腦運算的結果也不受個別電腦的影響, 網頁主以最
受歡迎的服務各種手法欺瞞搜尋引擎, 祗能得逞於一時一地, 無法長久地全面地影響搜尋結果。
13. 2d. 搜尋引擎最佳化專員(SEO)
搜索引擎優化是 Search Engine Optimization 的譯名, 縮寫為 SEO。調整網站的內容, 讓它配合搜
尋引擎的排序法則, 稱為搜尋引擎最佳化專員。經過優化的網站, 明顯排名上升,而且可維持一段
時間。八成以上的陌生訪客, 多半以搜索引擎查找資料, 在 Google 等知名搜索引擎上的排名, 直
接影響網站的能見度。
以合理的手段, 優化網站的內容, 使之符合搜尋引擎的排名規則, 藉以迅速提高排名, 達到擴大網
站影響力的目的。
2006 年 2 月在歐洲曾經傳出一則新聞,德國 BMW 汽車公司的網頁被 Google 認定採用了不正當
的搜尋引擎行銷(Search Engine Marketing,SEM)手法,透過欺瞞行為來提高自身網頁在搜尋
引擎中的排名,以致遭到除名,雖然 BMW 後來改正了網頁,但重新登錄 Google 後 就變為新網
站,必須從頭累積可見度與搜尋排序。而藉著這次事件,也使得 SEM 的相關問題逐漸受到重
視。
搜尋引擎行銷有二種模式, 由搜尋引擎本身提供, Google 在網頁上端及右方提供贊助商連接, 由
廠商付費取得特定的廣告位置, ,這種做法被稱做「關鍵字行銷」。另一種方法, 是愚弄搜尋引
擎, 讓它以為該網頁很受歡迎, 將其放在搜尋結果的前面位置, 即「搜尋引擎最佳化專員」技術。
找出搜尋引擎建立索引的邏輯, 並配合其關鍵字排序, 據以修改網頁, 強化加權的項目, 就能提高
網頁的搜尋排序, 進而增加被用戶點選 的機率。
以使用者行為分析、關鍵字研究與搜尋引擎排序邏輯解析等手段, 影響搜尋引擎檢索結果的排
序, 是搜尋引擎所默許的, 但是以某些不正當手法, 提供排序結果, 祗適用於短暫的時間, 被發現後
將列入黑名單, 整個排序值歸零。
在網頁中塞進各式各樣當前熱門的關鍵字, 當用戶以這些關鍵字搜尋時, 該網頁就很容易的會出
現在搜尋引擎排序的前列。其實, 這種做法的意義不大, 被潛在客戶找到才是行銷的前提, 亂塞熱
門關鍵字的做法雖然能增加網站的能見度, 但這些熱門關鍵字與廠 商自身業務卻沒多少關係,
即使網頁藉此得到了很高的點擊率, 但用戶只是被熱門關鍵字誘使而點擊, 不會對業務產生正面
幫助。而正規的 SEO 則是要儘可能的準確找出潛在用戶。
3. 帳戶
您的 Google 帳戶能讓您使用多種 Google 服務,包括您的個人化首頁、Google 網上論
壇、Google 快訊、Froogle 購物清單以及個人化搜尋。 如果您有使用過任何上述的服務,您就
有一個 Google 帳戶。 如果您有 Gmail 帳戶,您就可以使用您的 Gmail 使用者名稱和密碼登入
您的 Google 帳戶。 如果您還沒有 Google 帳戶,您可以到
https://www.google.com/accounts/NewAccount 建立一個新帳戶。
當您建立 Google 帳戶時,便自動地取得許多 Google 服務的使用權,包含個人化搜尋、Google
網上論壇、Google 快訊以及您的個人化首頁。 如果您要從 Google 帳戶中刪除個人化搜尋服
14. 務,請在 Google 首頁上按一下 [我的帳戶] 連結,並在左邊的選單上選擇 [刪除個人化搜尋]。
請確認您已經登入 Google 帳戶,這樣才能看到 [我的帳戶] 連結。
注意: 如果您和別人共用電腦,而且不希望別人看到您的個人化首頁 (有可能會連結到您的
Gmail 帳戶) ,那麼請您務必在每次用完電腦時登出您的 Google 帳戶。
• Google 帳戶能做的事, https://www.google.com/accounts/ManageAccount
Alerts
Analytics
Base
Calendar
Froogle Shopping List
Gmail
Google in Your Language
Groups
News
Notebook
orkut
Page Creator
Personalized Homepage
Personalized Search
Picasa
Reader
Sitemaps
Spreadsheets
Video
Google 的帳戶, 不以使用 Gmail 為前提, 祗要是有效的電子郵件帳號就可以。
必須先開設 Google 帳戶, 才能享受 Google 的進階服務: GoogleAnswer[懸賞提問]、Google 快
訊、Google 網上論壇、Froogle[購物清單]、Gmail、個人化搜尋、Google 使用您的語言等。反
之亦然, 已經使用以上的 Google 服務之一, 就有了 Google 帳戶。已有 Gmail 帳戶的使用者, 就是
Google 帳戶的使用者名稱和密碼。
Google 帳戶本身是免費的, 不過, 使用 GoogleAnswer[懸賞提問]、文字廣告[AdWord]等有價服務,
仍需以信用卡付費。
就像電腦上的其他帳戶, 申請 Google 帳戶沒什麼特別之處, 祗需鍵入三項資料: 電子郵件地址、
密碼、名稱及其它, 不要求填寫任何個人資料, 不需要身份證字號, 也不要求地址、電話, 簡單乾
15. 淨。
帳戶的使用者名稱就是您完整的電子郵件地址。接著, 就照著步驟進行即可, 熟稔網路的運作, 就
沒有問題; 若有任何問題, 最大的可能還是使用者本身對網路及電子郵件不熟悉所造成, 向
Google 抱怨之前, 先請教朋友, 排除問題的速度比較快。
兩招就能排除多數的狀況:
• 打開瀏覽器的 Cookie 設定, 設定為接受狀態
• 打開電子郵件信箱, 找到 Google 帳戶驗證電子郵件, 並回覆它
開戶成功之後, 隨時可進入 Google 帳戶控制中心檢視並修改相關的資料。
任何時候都可以刪除帳戶, 同時也刪除與該帳戶有關的所有 Google 服務, 包括: orkut 個人資料、
搜尋記錄和個人化首頁等; 如果此帳戶也是 Gmail 帳戶, 將再也無法使用該電子郵件服務。不過,
若還有未完成的交易(例如, 使用「GoogleAnswers」[懸賞提問]服務), 仍須負擔該等費用。
字詞驗證係避免被軟體誤用。必須同意 Google 的服 務條款和隱私權 政策。
從 Google 首頁, 點選右上角的登入。
並點選 [我的帳戶] 修改或取消 Google 帳戶。
3a. 個人資料
從建立 Google 帳戶進入, https://www.google.com/accounts/CreateAccount, 填入電子郵件地址、自
選密碼、字詞驗證後, 點選我接受:創建我的帳戶。
Google 寄信到電子郵件地址, 依照指示, 接受驗證, 點選指定的連結, 立即啟用 Google 帳戶。
選擇安全的密碼是很重要的事。Google 有些建議。
請勿以下列項目或其部份做為密碼:
• 使用者名稱。
• 真實姓名。
• 任何名字。
• 生日、電話號碼、地址、身份證字號或學生證號碼。
16. • 可在任何語言字典中查到的字。
• 字典中常見的數字/字母取代方法,例如用 0 代替字母 O、用數字 1 代替字母 L、用數字
3 代替字母 E 等。
• 在此或網路上找到的任何密碼範例。
好密碼應符合下列條件之一:
• 加入標點符號,例如 .,!@# 等。
• 混合使用大小寫字母。
• 至少有 8 個字元。 密碼越長,安全性越高。
• 選擇有趣的詞句、一句詩詞、或一段歌詞。 然後取每個字的第一個字母做為您的密碼。
確定您沒有因此意外地造出一個在字典上查得到的單字!
• 走上街頭或停車場,記下您所看到前三或四個牌照。拿掉重複的字母與號碼,用剩下的
號碼組合成您的密碼。
• 找出其他的方式隨意用字母和數字設定密碼,例如翻開書本,將您所見到的前十個名詞
的第三個字母組合成密碼。 善用您的創意吧。
Google 示範一個很複雜但不會忘記的密碼:
• 我們將取材自 Lewis Carroll 的詩 Jabberwocky: Twas brillig, and the slithy toves did gyre
and gimble in the wabe.
• 現在,我們擷取每個字的第二個字母: wrnhloiyninha。
• 其中有些字母重複了,所以我們可以用數字和/或其他符號來取代這些字母,例如:
wrnhloiy!3%7a。
• 來玩玩吧!現在我們把取自形容詞單字的字母變成大寫: wRnhLoiy!3%7a。
• 結果就成了看起來滿詭異,但很難被破解的密碼: wrnhloiy!3%7a。這麼做還有一個附
加的好 處,若以比較有系統的方式設定密碼,萬一以後不小心忘記 密碼了,還可以想辦
法重新組合出來。 設定自己的密碼時,您可以像這樣利用一個比較容易記憶的系統。
將您的密碼保存在安全的地方
• 不要將密碼告訴任何人。
• 別將您的密碼寫下來。
• 每隔幾個月變更一次密碼。
3b. 服務資訊
Google 的服務以免費為原則, 而且不會詢問用戶的私人資料, 以免打擾用戶的使用興緻。但是以
個人為基礎的服務, 免不了必須請用戶提供私人資料, 建立個人帳戶。除非涉及金錢交易, 祗需提
供電子郵件地址及自行選定的密碼即可。
Google 有 12 種服務, 必須先申請 Google 的個人帳戶, 才能享受, 申請個人帳戶是免費的。
17. ��.1Google 快訊
��.2Google 網上論壇
��.3個人化搜尋
��.4Google Answer[懸賞提問]
��.5Gmail/交談
��.6Froogle[購物清單]
��.7個人化網頁
��.8使用的語言
��.9谷 歌視訊上載計劃
��.10文字廣告[AdWord]
��.11Google 新聞
��.12orkut
3b1. Google 快訊
指定搜尋字彙, 由 Google 快訊幫忙追蹤這些字彙的發展, 然後送到 Google 個人帳戶的電子郵件
地址, 指定寄送的格式: 純文字或 HTML。
可指定搜尋的範圍: 新聞、網頁、新聞及網頁、群組[即網上論壇]; 並指定追蹤的頻率: 一天一
次、即時、一週一次。
建立之後, 隨時可以再回來修改或刪除。
3b2. Google 網上論壇
閱讀公開的 Google 網上論壇, 不需要任何帳戶。閱讀封閉的 Google 網上論壇或張貼、回應
Google 網上論壇, 都需要有帳戶。
第一次進入 Google 網上論壇時, 應先設定別人向自己發出邀請函的授權設定:
• 不允許群組管理員邀請我到他們的群組中
• 不允許群組管理員直接將我新增到他們的群組中
不喜歡加入別人的群組, 祗想在旁默默的觀看, 應勾選第一個; 不願意被過度熱心的群組管理員打
擾, 應勾選第二個, 必須回信後, 才能被新增至對方的群組中。
3b3. 個人化搜尋
Google 會記錄所有的網頁、圖片、新聞及 Froogle 搜尋經過, 在網頁上呈現。
18. 左邊為過去兩天的搜尋記錄, 沒有點擊結果的搜尋會被特別標示; 右邊有個日曆, 依搜尋總數以不
同的顏色深度呈現。
對瞭解過去的行為, 很有幫助。
為了提供這項服務, 個人化搜尋會儲存用戶在 Google 的活動資訊, 包括搜尋查詢、點選的項目及
搜尋的日期和時間。累積足夠的資訊後, Google 分析判斷之後, 個人化搜尋就能主動提供額外的
資訊, 並據以改善個人的搜尋結果。
在 Google 的活動資訊被電腦截取, 有被監視的感覺, 一但被外力介入, 個人的隱私就一覽無遺, 包
括 IP 位址、瀏覽器類型、瀏覽器語言和可識別您瀏覽器的 cookies。
任何時間都可以暫時地或永久地要求 Google 停止儲存用戶的搜尋資訊。Google 有一個分離的記
錄系統作為審查之用, 並以此改善服務品質。包括審查 Google 的廣告系統、瞭解最受使用 者歡
迎的功能、改善搜尋結果的品質, 最重要的是幫助 Google 對抗各種外來的破壞, 如: 抵禦服務攻
擊。
根據以往的搜尋記錄找到搜尋結果。 個人化搜尋根據以往的搜尋記錄和點擊過的搜尋結果, 將
最相關的特定結果, 移到比較前面的位置。
瀏覽並搜尋以往的搜尋記錄和點擊過的搜尋結果。可以移除任何您不希望被包含在個人化搜尋
中的項目。
將您最喜愛的網站加入書籤, 並新增您可以搜尋的標籤和附註。
3b4. Google Answer[懸賞提問]
提出問題, 設定價碼, 得到答案。或者瀏覽別人提出的問題, 主動回答該問題, 得到適當的報酬, 甚
至得到額外的小費。任何人都可以瀏覽別人提 出的問題, 瀏覽已經被回答的問題。
提問者需填寫若干資料: 問題、主題、價碼、領域, 再填寫信用卡資料即可。
反應太好, 願意回答問題的研究者太多, 從 2005 年 12 月 26 日起, Google 暫停新研究者的申請。
3b5. Gmail/交談
Gmail 是 Google 公司推出的免費電子郵件, 無法經由申請而來, 必須由使用 Gmail 的朋友推薦, 才
可以取得。45 天不使用, 就會被刪除。