Google如何看待多語言版本的網頁?
多語言網頁是指所提供的內容含有兩種以上語言的網頁。多語言網頁的例子包括:加拿大公司的網頁有英文及法文版本,或是有關拉丁美洲足球的網誌同時提供西班牙文和葡萄牙文版本。
多地區網頁是指明確鎖定不同國家/地區使用者的網頁。某些網頁既是多地區網頁,也是多語言網頁 (舉例來說,一個網頁可能會有美國和加拿大地區兩種版本,而加拿大地區的內容又同時含有法文和英文版本)。
管理網頁的多重地區版本
以下是一些提示,可供您確認本地化的內容是否出現在適當語言的搜尋結果中。
確認網站的語言相當明確
Google 只會使用網站上顯示的內容來判斷網頁語言。並不會使用任何語言代碼,例如 lang
屬性。您可以針對每個網站的內容和瀏覽項目使用單一語言,並避免將翻譯內容與原文並排顯示,以協助 Google 正確地判斷網站語言。如果以單一語言保留大部分內容的同時,只翻譯網站上的重複性文字 (通常發生這種情況的頁面都含有使用者產生的內容),則含有各種重複性語言的搜尋結果中,如果多次出現相同的內容,就可能會留給使用者不好的印象。
使用 robots.txt 可以防止搜尋引擎檢索網頁上自動翻譯的網站。自動翻譯有時詞不達義,可能會被視為垃圾內容。更重要的是,劣譯或呆板不順口的翻譯,可能讓網頁的瀏覽者反感。
確認各個語言版本都能很容易找到
將各個語言的內容存放在不同的網址中。請不要使用 Cookie 來顯示網站的翻譯版本。考慮讓各種語言版本的網站都能相互連結。這樣一來,瀏覽德文版網站的法文使用者只需按一下連結就能連往適合他的語言版本。
避免自動判斷使用者所用語言並重新導引到該語言版本。這些重新導向動作可能會讓使用者 (以及搜尋引擎) 無法檢視您網頁的所有版本。
謹慎選擇網址
Google 是根據網站的內容來判斷其語言,但是網址本身也能夠讓使用者判斷網站內容。例如,下列 .ca
網址的子網域或子目錄使用 fr
來表示其內容為法文:http://example.ca/fr/vélo-de-montagne.html
和 http://fr.example.ca/vélo-de-montagne.html
.
在網址中註明語言也能夠幫助您找出網頁中多語言內容的問題。
您可以翻譯網址中的文字,也可以使用國際化網域名稱 (IDN)。請務必在網址中使用 UTF-8 編碼 (事實上,我們建議盡量都使用 UTF-8),並記得讓這些在連往這些網址時,以正確的逸出字元作為網址。
將網頁內容鎖定為針對特定國家/地區
如果 Google 察覺到某個網頁的目標國家/地區,就能夠利用此資訊來改善不同國家/地區的搜尋結果品質。Google 通常會使用下列元素來判斷網頁鎖定的目標國家/地區:
- 國家代碼頂層網域名稱 (ccTLDs)。這些名稱受限於特定國家/地區 (例如,.de 表示德國、.cn 表示中國),因此對使用者和搜尋引擎兩者來說,是表示網頁明確鎖定特定國家/地區的顯著指標(有些國家/地區對於 ccTLD 的使用者有所限制,所以請務必先瞭解詳情)。我們也會將較少人使用的 ccTLD (例如 .tv、.me、etc.) 視為 gTLD,因為我們發現相較於以國家為目標的代碼,使用者和網頁管理員經常認為這些代碼更加普通 (我們沒有完整的清單可記錄我們視為 gTLD 的 ccTLD,因為這份清單會隨時改變)。查看 Google 的一般網域完整清單。
- 地理定位設定。 您可以使用網頁管理員工具中的指定國家/地區工具,向 Google 指定網頁鎖定的目標國家/地區。您的網頁必須要有一般頂層網域名稱,才能這麼做。但是,如果您的網頁鎖定了多個國家/地區,則請勿使用這項工具。例如,將介紹蒙特婁當地餐廳的網頁設定以加拿大使用者為目標就很有道理,但是將那些著重於法國、加拿大和馬利等法語使用者的網頁,設定以加拿大使用者為目標,就不太合理。
注意:因為地區性頂層網域 (例如 .eu 或 .asia) 並非指定單一國家/地區,所以 Google 會將其視為一般頂層網域。
- 伺服器位置 (透過伺服器的 IP 位址判定)。 伺服器位置通常鄰近您的使用者所在地區,也可能透露網頁的目標群眾所在。某些網頁會使用分散式內容傳送網路 (CDN),或是將主機架設於網路伺服器基礎架構較佳的國家/地區,此時的位置就不具指標意義。
- 其他指標。 其他有關您網頁目標群眾的線索來源還包括網站上的當地住址和電話號碼、是否使用當地語言和貨幣、來自其他當地網頁的連結和/或是否使用 Google 我的商家 (如果有)。
Google 不會使用位置中繼標記 (例如 geo.position
或 distribution
) 或 HTML 屬性來進行地理定位。
網址結構
考慮使用網址結構,這可以讓您將網頁內容依照不同地理區域加以劃分。請參考以下表格,以便瞭解您可以選擇的方法有哪些:
網址結構 | 範例 | 好處 | 壞處 |
特定國家/地區 | example.ie |
|
|
有 gTLDS 的子網域 | de.example.com |
|
|
有 gTLD 的子目錄 | example.com/de/ |
|
|
網址參數 | site.com?loc=de |
|
|
地理定位並非 100% 準確,所以您必須設想,當使用者瀏覽到錯誤的網頁版本時,您應該怎麼做。在所有網站上顯示連結,讓使用者能夠自行選擇地區和/或語言,便是一種可行的作法。
重複的內容和國際網頁
有時候,這類針對不同地區提供特定內容的網頁,如果又同時提供了多種語言版本,便可能會在不同的網址上放置相同或類似的內容。只要該內容是針對不同國家/地區的使用者,通常就不成問題。雖然我們強烈建議針對各種不同族群的使用者提供不同的內容,但是要做到這一點並不容易。一般來說,在 robots.txt 檔案中禁止檢索,或是使用 "noindex" 漫遊器中繼標記,就不需要「隱藏」重複的內容。但是,如果您在不同網址上提供同樣的內容給相同使用者 (例如,如果 example.de/
和 example.com/de/
同時顯示了給德國使用者的德文內容),就應該選一個偏好的版本,並適當地進行重新導向 (或使用 rel=canonical 連結元素)。此外,建議您按照 rel-alternate-hreflang 指南,確認您已向搜尋資訊的使用者提供正確的語言或區域網址。
本文引自https://support.google.com/webmasters/answer/182192
針對多語言網頁,NC會採用同一網域、子資料夾、各別資料庫方式,或是不同網域、上層資料夾、各別資料庫。
當採用不同網域規格時,我們可以提供美國HE主機、香港IBM主機、台灣HINET主機、北京主機(需要搭配.cn網域跟主機備案)、英國主機。
我們近期承接的英國案例分享
Cubic Logistics位於英國的一間物流公司(http://www.cubiclogistics.co.uk),主要用戶在英國全島、香港、台灣。
請英國端測試發現連台灣HINET台北東七機房並不是很順暢,我們改使用美國HE跟其他東岸主機測試,最後選用Quadranet主機,採用單一主機服務三國客戶的方式進行。