2009年4月21日 星期二

Google & SEO - 3

網站品質指南-明確的指南:
1.隱藏式文字與連結
內容中的隱藏式文字或連結會分別向搜尋引擎和訪客提供不同的資訊,因此可能導致客戶的網站被歸為不可信賴。隱藏文字(例如過多關鍵字)的方式有很多種,例如:
(1)在白色背景上使用白色文字
(2)將文字藏在圖片背後
(3)使用 CSS 隱藏文字
(4)將字型大小設為 0

隱藏式連結是Googlebot可以檢索但是使用者肉眼無法看到的連結,看不到的原因有:
(1)連結是由隱藏式文字所組成 (例如文字與背景色彩相同)。
(2)使用 CSS 製作出僅 1 個像素高的極小超連結。
(3)將連結隱藏在某個小字元內,例如段落中的連字號。
(4)如果網站被認定為含有故意使人誤解的隱藏式文字和連結,該網站可能會從 Google索引中移 除,也不會顯示在搜尋結果網頁中。Google在評估網站以瞭解是否包含隱藏式文字或連結時,會檢查網站中是否夾有訪客不易識別的內容。例如,是否有任何文字或連結純粹為搜尋引擎檢索而設,而不是為了供訪客瀏覽。

如果使用文字來說明搜尋引擎無法存取的內容,例如 Javascript、圖片或 Flash 檔案,則許多使用螢幕閱讀器、行動瀏覽器、無外掛程式瀏覽器,以及連線速度較慢的訪客也會無法檢視該內容。為這些項目使用說明文字可增加網站的存取性。可以關閉瀏覽器的Javascript、Flash和圖片,或使用像是Lynx的文字瀏覽器,來測試其可存取性。
以下是網站可供存取的提示:
(1)圖片:使用替代屬性來提供說明文字。此外,Google建議在圖片周圍使用肉眼看得到的標題和說明文字。
(2)Javascript:將Javascript中相同的內容放置在無指令碼的標記中。如果使用此方法,請確定該內容與Javascript中的內容完全一樣,且此內容可對瀏覽器未啟用Javascript的訪客顯示。
(3)Flash:考慮將說明文字和網站導覽放置在Flash之外。
(4)影片:在HTML中包含與影片相關的說明文字,也可以考慮提供腳本。


2.偽裝、狡猾的Javascript重新導向和入口網頁
偽裝是指對使用者和搜尋引擎分別呈現不同的內容或URL。根據user agent來放送不同的結果,會造成客戶的網站被視為有欺騙的意圖,網站也會從Google索引中移除。

以下為一些偽裝的範例:
(1)對搜尋引擎呈現一頁 HTML 文字,但對使用者顯示一頁圖片或 Flash。
(2)對搜尋引擎顯示的內容與對使用者顯示的內容不同。
(3)如果網站有無法讓搜尋引擎檢索的元素(例如 Flash、Javascript 或圖片),不可對搜尋引擎提供偽裝的內容,相反的,網站上也無法檢視這些元素的訪客。例如:為已經關閉瀏覽器上的螢幕讀取器或圖片的使用者,提供描述圖片的替代文字。在無指令碼的標記中提供Javascript的文字內容。確定在兩個元素中提供相同的內容(例如,在Javascript與無指令碼標記中均提供相同的文字)。在替代元素中包含大量的不同內容會造成Google對網站採取動作。

狡猾的Javascript重新導向
當Googlebot將包含Javascript的網頁編入索引時,它會將該網頁編入索引,但對於在Javascript本身中隱藏的任何連結,Googlebot不會追隨這些連結或將其編入索引。使用Javascript是完全正當的網頁做法,但是,使用 Javascript 企圖欺騙搜尋引擎則是不容許的行為。例如,在Javascript中放置的文字與在無指令碼標記中放置的文字不同,因為這種作法會對使用者(會看到Javascript文字)和搜尋引擎(看到無指令碼文字)顯示不同的內容。基於這些原因,在 Javascript中嵌入會將使用者重新導向到不同網頁的連結,意圖對使用者顯示與搜尋引擎所見不同的網頁,將重新導向連結嵌入Javascript後,搜尋引擎會將原始網頁編入索引,而不會追隨連結,反而將使用者帶往重新導向的目標。就和偽裝一樣,這種做法是欺騙的行為,因為這會對使用者和Googlebot分別顯示不同的內容,並將訪客帶往和目標網頁不同的網頁。

單純地將連結放在Javascript內並不構成欺騙的行為。由於搜尋引擎通常無法存取Javascript的內容,因此搜尋引擎也無法存取Javascript內的合法連結(瀏覽器未啟用Javascript的訪客也同樣無法存取)。可以改為將連結保留在Javascript之外,或將連結複製到無指令碼標記中。

入口網頁
入口網頁是特別為搜尋引擎建立的網頁。入口網頁中包含許多連結,通常有數百個之多,但這些連結對於訪客幾乎沒有什麼幫助,此外入口網頁內也沒有重要的內容。HTML Sitemap對客戶的訪客而言是重要的資源,不過必須確保訪客可以很容易的瀏覽到這些連結的網頁。 如果想要包含多個連結,須考慮將這些連結分類到不同的類別中或多個網頁內。並確定這些連結會讓訪客瀏覽到網站上的某些區段,而不是只供搜尋引擎檢索。


3.自動查詢
Google的不允許在事先未經Google明確許可下,將任何形式的自動查詢傳送到Google的系統。傳送自動查詢會消耗許多資源,其做法包括使用任何軟體(如 WebPosition Gold)將自動查詢傳送到Google,以確認網站或網頁在各種 Google 查詢搜尋結果中的排名。


4.濫填關鍵字
濫填關鍵字是指在網頁上填滿關鍵字,來試圖操控網站在Google搜尋結果中的排名。填滿關鍵字的網頁會讓使用者有不好的使用經驗,並會危害到客戶網站的排名。 應將重點放在建立有用的、資訊豐富的內容,並在內容中適當的使用與上下文有關聯的關鍵字。若要修正這個問題,應檢查網站中是否有濫用的關鍵字。濫用的關鍵字通常是一長串或好幾個段落隨機重複的關鍵字。關鍵字通常會是隱藏式文字,或是隱藏在標題標記或alt屬性中。


5.重複的內容
重複內容一般是指在網域內有大部分內容與其他內容相同或十分相似。多半的重複內容其原意並不是要進行欺騙。非惡意的重複內容可能包括:
(1)可針對行動裝置產生的一般網頁和精簡網頁的討論區
(2)透過不同的URL儲存顯示或連結的項目
(3)列印用網頁
但在某些情況下,有心人士會故意在整個網域中重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。這種欺騙的做法會帶來不好的使用經驗,因為訪客會在搜尋結果中看到大量相同的內容。網站的每一篇文章都有「一般」版和「列印」版,且均未以robots.txt 檔案攔截或使用noindex中繼標記,Google只會列出其中一篇文章。有網站為了操控Google的排名和欺騙Google的使用者而顯示重複內容,針對涉及這樣做法的網站,Google會對其索引和排名進行適當的調查。因此,網站的排名會受到影響,也可能會完全從Google索引中移除,而不再於搜尋結果中顯示。

網站可以採取一些步驟來主動處理重複內容的問題,並確保訪客會看到客戶希望他們看到的內容。
(1)考慮阻止網頁被編入索引:可以指引Google到客戶偏好的版本,而非交由Google的演算法來決定文件的「最佳」版本。舉例來說,如果不希望Google將網站文章的列印版編入索引,請禁止這些目錄,或在 robots.txt 檔案中使用正規表示法。
(2)使用 301:如果已重新建構網站,在.htaccess檔案中使用301重新導向(永久重新導向),以對使用者、Googlebot和其他自動尋檢程式進行智慧型的重新導向(在Apache中,可使用.htaccess檔案進行此步驟;在IIS中,則透過管理控制台進行)。
(3)維持一致性:嘗試讓內部連結維持一致性。例如,請勿連結至 http://www.example.com/page/、http://www.example.com/page以及http://www.example.com/page/index.htm
(4)使用最上層網域:為協助Google呈現文件最適當的版本,每次在處理特定國家/地區的內容時,應使用最上層網域。舉例來說,與 www.example.com/de或de.example.com相比,Google較容易清楚 www.example.de包含的是與德國相關的內容。
(5)審慎的聯合顯示:如果客戶將內容在其他網站上聯合顯示,Google會在每一個指定的搜尋中一律顯示Google認為最適合使用者的版本,無論客戶是否偏好該版本。但須確認每一個聯合顯示客戶內容的網站都包含可連回客戶原始文章的連結。也可以要求使用聯合內容的網站使用robots.txt 在他們的網站上封鎖版本。
(6)使用網站管理員工具告訴Google要如何為網站建立索引:可以告訴Google客戶偏好的網域(例如www.example.com或http://example.com)。
(7)盡量減少重複刻板的內容:不要在每一頁底端顯示冗長的版權文字,可改為簡短的摘要,然後再連結到有詳細內容的網頁。
(8)避免發佈殘缺不全的網頁:使用者不喜歡看到「空白」網頁,因此請避免使用預留位置。不要發佈尚未包含實際內容的網頁。如果已經建立一些預留位置網頁,需使用 robots.txt 阻止Google檢索這些網頁。
(9)瞭解內容管理系統:確保熟悉內容在網站上的顯示方式。Blog、論壇和相關的系統通常會以多種格式顯示相同的內容。Blog項目可能會出現在Blog的首頁、存檔網頁和其他具有相同標籤項目的網頁中。
(10)盡量不要有相似的內容:如果有許多相似的網頁,應考慮擴充每個網頁,或將其合併成一張網頁。如果客戶有一個旅遊網站,其中以不同的網頁介紹兩個城市,但在這些網頁上都有相同的資訊,那麼可以將這些網頁合併成一個與這兩個城市都有關的網頁;也可以擴充每個網頁來含每個城市特有的內容。

網站上重複的內容不能構成對網站採取動作的理由,除非重複的內容是為了欺騙和操控搜尋引擎結果。 如果網站因重複內容的問題而受到影響且未按照上述進行變更,Google會自行選擇要在搜尋結果顯示的版本。


6.植入病毒和其他惡意程式
利用瀏覽器的安全漏洞來植入如惡意軟體、間諜軟體、病毒、廣告軟體和特洛伊木馬程式等軟體的網站,不但違反 Google品質指南,同時也可能會從 Google 索引中移除。

在許多情況下,植入惡意程式的網站本身已成為駭客的攻擊目標,直到從Google收到通知,客戶可能才會知道之自己的網站已經遭到侵害。 如果客戶的網站已標示為含有惡意程式,Google會向訪客顯示警告,也會透過網站管理員工具的網站摘要網頁通知客戶。Google也會透過電子郵件,將通知傳送給受影響網站的網站管理員。

7.極少或無原始內容
改善網站在 Google 搜尋結果排名的最重要步驟之一,就是確定網站包含豐富的資訊,其中的關鍵字應具有關聯性且用法正確,並可指出內容的主題。然而,有些網站管理員會嘗試藉由建立一個字數很多,但內容極少或甚至沒有內容的網頁,來改善網頁排名並吸引訪客。這種經過剪輯或其他自動產生的網頁對使用者並無任何價值,對於只想利用這類網頁來得到更高排名的網域,Google 會採取必要動作。
這類的例子有:
(1)內容貧乏的聯盟網站:這些網站提供訪客極少或是沒有價值的內容或服務,同時將訪客傳給聯盟計劃(Affiliate Program)的網站,藉此收取每次點擊付費(PPC)的收益。這些網站通常沒有原始的內容,是一種沒有獨特內容的模造(cookie-cutter) 網站或範本。
(2)入口網頁:專為搜尋引擎建立的網頁
(3)自動產生內容:由程式產生的內容。這類內容中的文字段落通常是隨機產生,其內容讓讀者不知所云,但卻包含搜尋的關鍵字。
(4)剪輯內容:有些網站管理員會使用取自知名網站的隨機且不相關的內容,他們誤以為增加網頁數量是一項極佳的長期策略。如果網頁上都是剪輯的內容,而缺乏其他由客戶的網站所提供的有用服務或資訊,即使內容來源的品質很高,也無法增加網頁對使用者的價值。花一些時間製作原始內容,讓網站有與眾不同,這會讓訪客不斷回到網站,並可提供有用的搜尋結果。
(5)聯盟是一種很好的行銷方式,但前提是客戶要能為使用者增加一些價值,並製作出有用的內容,讓使用者有造訪客戶網站的理由。例如,客戶可以提供產品評論、等級評比和產品比較。

Reference:http://www.google.com/support/webmasters/

沒有留言:

張貼留言