[SEO] 什麼是網站地圖 Sitemap


[SEO] 什麼是網站地圖 Sitemap

介紹網站地圖 Sitemap 概念與設定上有需要注意的細節。

Sitemap 是什麼

一種用來提供網站資訊的檔案,您可以在其中列出網頁、影片和其他檔案的資訊,並呈現這些內容彼此間的關係。Google 等搜尋引擎都會讀取網站的 Sitemap 檔案,藉此以更有效率的方式檢索網站。

簡單來說就是網站地圖,透過 Sitemap 爬蟲可以快速知道網站內有哪些資訊,可以更有效地檢索網站。

Sitemap 格式

以 Google 為例所支援格式:

  • XML
  • RSS、mRSS 和 Atom 1.0
  • 文字

注意:

  • 單一 Sitemap 在未壓縮時的上限為 50MB,且最多只能 50,000 個網址。(網址超過時需分割數個較小的 Sitemap)

XML

格式須符合Sitemap 通訊協定,下面只針對基本介紹,如果你的網站較為複雜如多語系(網址不同)或分電腦跟手機版,可以參考協定去設定

注意:

  • 所有的值都必須 實體逸出(entity-escaped)
  • Google 目前不支援在 Sitemap 中的 <priority> 屬性
  • 不要使用相對網址,例如 ./mypage.html
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2021-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
    </url>
    <url>
        <loc>http://www.example.com/result</loc>
        <lastmod>2021-11-11</lastmod>
    </url>
   ...
</urlset>
Sitemap 標記定義
屬性必要說明
<loc>網頁的 URL
  • 通訊協定開頭(例如 http)
  • 需少於 2,048 個字元
<lastmod>最後修改日期
<changefreq>網頁更新的頻率,此值只做為提示而非指令,主要還是看搜尋引擎怎麼使用此值去做處理
  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never
<priority>URL 的優先順序。
  • 有效值的範圍為 0.0 到 1.0
  • 設定此值,並不會影響在搜尋引擎網站排名
Entity-escaped
字元逸出碼
& 符號&&amp;
單引號&apos;
雙引號&quot;
大於>&gt;
小於<&lt;
問題:
http://www.example.com/view?widget=3&count>2

正確:
http://www.example.com/view?widget=3&amp;count&gt;2

RSS、mRSS 和 Atom 1.0

網誌含有 RSS 或 Atom 動態消息,您可以透過 Sitemap 提交動態消息的網址。

注意:

  • 支援 RSS 2.0 和 Atom 1.0 動態消息。
  • 可以使用 mRSS (媒體 RSS) 動態消息將網站中影片內容。

文字

將每個網址分行列出,例如:

http://www.example.com/
http://www.example.com/result

注意:

  • 檔案需使用 UTF-8
  • 請勿加入網址以外的內容。
  • 檔名沒有命名規定,但副檔名必須是 .txt ,例如 sitemap.txt。

參考資料


作者: PuTaoNi
版權聲明: 本站所有文章除特別聲明外,均採用 CC BY 4.0 許可協議。轉載請註明來源 PuTaoNi !
 上一篇
[SEO] 如何在 Hexo 建立網站地圖 Sitemap [SEO] 如何在 Hexo 建立網站地圖 Sitemap
介紹如何快速建立網站地圖(Sitemap.xml),如果每次新增網頁都要修改也太麻煩,所以有大神已經幫我們寫好套件 hexo-generator-sitemap,只要安裝套件後便可以自動產生 Sitemap.xml。
2021-11-04
下一篇 
[工具] 網路工具-SharpLab [工具] 網路工具-SharpLab
透過 SharpLab 可以瞭解 C#語法糖(Syntactic sugar)與 IL(Intermediate Language),當然也可以透過一些工具去反編譯出來,但身為工程師就是懶,能少做一些事情就少做。
2021-10-30
  目錄