一、什么是Sitemap
Sitemap(即站點地圖)就是您網站上各網頁的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現并了解您網站上的所有網頁。您還可以使用Sitemap提供有關您網站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。
百度對已提交的數據,不保證一定會抓取及索引所有網址。但是,我們會使用Sitemap中的數據來了解網站的結構等信息,這樣可以幫助我們改進抓取策略,并在日后能更好地對網站進行抓取。
此外,Sitemap 與搜索排名沒有關系。
二、百度Sitemap支持哪些格式
百度Sitemap協(xié)議支持文本格式和xml格式,可以根據自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:
1.第一種格式樣例:txt文本格式
在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過搜索資源平臺進行提交
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南:
· 文本文件每行都必須有一個網址。網址中不能有換行。
· 不應包含網址列表以外的任何信息。
· 您必須書寫完整的網址,包括 http。
· 每個文本文件最多可包含 50,000 個網址,并且應小于10MB(10,485,760字節(jié))。如果網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
· 文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式
單個xml數據格式如下:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<urlset>
<!--必填標簽-->
<url>
<!--必填標簽,這是具體某一個鏈接的定義入口,每一條數據都要用<url>和</url>包含在里面,這是必須的 -->
<loc>http://www.yoursite.com/yoursite.html</loc>
<!--必填,URL鏈接地址,長度不得超過256字節(jié)-->
<lastmod>2009-12-14</lastmod>
<!--可以不提交該標簽,用來指定該鏈接的最后更新時間-->
<changefreq>daily</changefreq>
<!--可以不提交該標簽,用這個標簽告訴此鏈接可能會出現的更新頻率 -->
<priority>0.8</priority>
<!--可以不提交該標簽,用來指定此鏈接相對于其他鏈接的優(yōu)先權比值,此值定于0.0-1.0之間-->
</url>
<url>
<loc>http://www.yoursite.com/yoursite2.html</loc>
<lastmod>2010-05-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
上述Sitemap向百度提交了一個url:http://www.yoursite.com/yoursite.html
若有多條url,按照上述格式重復<url></url>之間的片斷,列明所有url地址,打包到一個xml文件,向搜索資源平臺進行提交。
? Copyright 2023 深圳藍曬科技有限公司. 粵ICP備2023054553號-1