解決 Google Console 這是重複網頁;使用者未選取標準網頁的問題 - Blogger

解決重複網頁;使用者未選取標準網頁

對於有在經營網路事業的人來說,Google Console 應該是相當常用的工具。除了可以用它來檢查網址加快索引速度之外,也能檢視網站被搜尋引擎收錄的進度。


然而奇怪的是,有些網頁雖然成功被 Google 爬蟲索引了,但在涵蓋範圍 > 排除的資料中,卻出現一堆「這是重複網頁;使用者未選取標準網頁」的錯誤。不但清一色都是 ?m=1 的行動裝置網頁,且還卡了半年都沒消失。

 

 

根據官方說明,Google 爬蟲會自動判定檢索標準與替代網頁,也就是說理想的狀態下它會自動將一般的電腦桌面版網頁 (.html) 定為標準網頁,並列入「已提交並建立索引」中;而行動版網頁 (.html?m=1) 則會列入涵蓋範圍 > 替代頁面 (有適當的標準標記) 中。

 


https://mysite.com/2012/01/page.html #桌面版
https://mysite.com/2012/01/page.html?m=0 #給行動裝置看的桌面版
https://mysite.com/2012/01/page.html?m=1 #行動裝置版

 

但網站放了半年,那一大串的「這是重複網頁;使用者未選取標準網頁」卻像是纏人的前男女朋友一樣卡在 Google Console 上,看了實在讓人心煩。目前只能判斷應該是 Google Console、爬蟲或是搜尋引擎本身有 Bug 造成的錯誤,否則沒理由僅幾個頁面成功被爬蟲列入「替代頁面 (有適當的標準標記) 」,而一堆網頁則還是出現重複網頁的錯誤。


因此本文糊塗流浪貓將介紹各位如何解決「重複網頁;使用者未選取標準網頁」的錯誤。習翠維尼


 

用 HTML 判斷式告訴爬蟲標準網址(canonical)與替代頁面(alternate)

由於 Google 的檢索代理程式 (爬蟲) 有 Googlebot Smartphone 智慧型手機和 Googlebot Desktop 桌面型等種類,因此我們只要用判斷式讓爬蟲依照自身類型進行標記即可。

 

進入主題 > 自訂 > 編輯 HTML,於 head 區段新增以下程式碼。

 

<link expr:href='data:blog.canonicalUrl' rel='canonical'/>  
<b:if cond='data:blog.isMobile'>
    <link expr:href='data:blog.canonicalUrl + "?m=1"' media='only screen and (max-width: 640px)' rel='alternate'/>
<b:elseif cond='data:blog.canonicalUrl + "?m=0"'/>
    <link expr:href='data:blog.canonicalUrl + "?m=0"' rel='alternate'/>
<b:else/><!-- xi virus -->
    <link expr:href='data:blog.canonicalUrl' rel='canonical'/>
</b:if>

 

這段程式碼翻成白話文就是:如果爬蟲所看到的頁面是行動裝置 (?m=1) 版本,則將其標記為替代頁面 (alternate);若看到的是給行動裝置的桌面 (?m=0) 也是標記為替代頁面;若看到的是桌面版 (.html) 則列為標準頁面 (canonical)。如此一來,應該可以加快解決重複網頁,使用者未選取標準網頁的問題。


另外一種寫法是將三種裝置的頁面版型直接寫入 head 中讓爬蟲自己挑,簡稱爬蟲自助餐法。


<link expr:href='data:blog.canonicalUrl + "?m=0"' rel='alternate'/>
<link expr:href='data:blog.canonicalUrl + "?m=1"' media='only screen and (max-width: 640px)' rel='alternate'/>
<link expr:href='data:blog.canonicalUrl' rel='canonical'/>

 

 

為行動裝置新增 sitemap.xml?m=1 索引

進入 Google Console > Sitemap 頁面,為行動裝置版新增專用的索引。如果你勤勞一點,也可以將 http 和 www 的 sitemap 分別加入。


https://mysite.com/sitemap.xml
https://mysite.com/sitemap.xml?m=1
https://mysite.com/sitemap.xml?m=0
用 RSS 與 atom 加速索引
https://mysite.com/feeds/posts/default?orderby=updated
https://mysite.com/atom.xml?redirect=false
https://mysite.com/rss.xml

 

 

結語

目前筆者還在評估以上兩種方式的成效,但按照國外網友的心得分享看來,應該能獲得不錯的結果。唯 Google Console 與爬蟲通常要三天至一個星期才能看得到結果 (畢竟 Google 爬蟲真的很忙),後續有任何結果我都會持續更新。


另外 2021 年前後,Google 也宣佈提高對行動裝置網頁的權重,因此未正確標記的重複網頁過多,可能導致 Google 降低網站評價與排名,希望各位站長謹慎面對這個問題。 


 

延伸閱讀

Google 檢索器 (使用者代理程式) 總覽

平板電腦和功能型手機 SEO - Google 搜尋中心

用 canonical 標準網址加速網站遷移的重複網址判定

更多 Blogger 技巧

更多 SEO 戰技

用 canonical 與 alternate 標記解決使用者未選取標準網頁的測試結果 

成功解決 Console 重複網頁;使用者未選取標準網頁的錯誤,一星期後的成果回顧 

修正未設定可視區域, 累計版面配置轉移 (CLS) 錯誤 






留言

這個網誌中的熱門文章

寶鐘瑪琳中之人前世照片、年齡分析