在线客服与您一对一交流
当前位置: 主页 > 行业新闻 > seo >

如何制作对应关系sitemap文件

  通过XML文件描述url级别的PC页与手机页的对应关系,网站当前有对应关系的所有PC页面url均需要给出。(xml格式sitemap的基础制作方法可点击了解

  具体的对应关系sitemap(url级别)格式如下:

  <?xml version="1.0"encoding="UTF-8"?>

  <urlset>

  <url>

  <!--必填标签,表示PC页的url地址 -->

  <loc><![CDATA[http://www.yoursite.html/yoursite.html]]></loc>

  <data>

  <display>

  <!—可选标签,表示该PC页对应的html5版式的手机页的url地址 -->

  <html5_url><![CDATA[http://html5.yoursite.html/yoursite.html]]></html5_url>

  <!—可选标签,表示该PC页对应的wml版式的手机页的url地址 -->

  <wml_url><![CDATA[http://wml.yoursite.html/yoursite.html]]></wml_url>

  <!—可选标签,表示该PC页对应的xhtml版式的手机页的url地址 -->

  <xhtml_url><![CDATA[http://xhtml.yoursite.html/yoursite.html]]></xhtml_url>

  </display>

  </data>

  </url>

  </urlset>

  例如:

  <?xmlversion="1.0" encoding="UTF-8"?>

  <urlset>

  <url>

  <loc><![CDATA[http://www.sina.com.cn/]]></loc>

  <data>

  <display>

  <html5_url><![CDATA[http://html5.sina.com.cn/]]></html5_url>

  <wml_url><![CDATA[http://wml.sina.com.cn/]]></wml_url>

  <xhtml_url><![CDATA[http://3g.sina.com.cn/]]></xhtml_url>

  </display>

  </data>

  </url>

  <url>

  <loc><![CDATA[http://www.sohu.com/]]></loc>

  <data>

  <display>

  <html5_url><![CDATA[http://html5.sohu.com/]]></html5_url>

  <wml_url><![CDATA[http://wml.sohu.com/]]></wml_url>

  <xhtml_url><![CDATA[http://3g.sohu.com/]]></xhtml_url>

  </display>

  </data>

  </url>

  </urlset>

  如何制作对应关系sitemap文件(pattern级别)?

  1、格式

  Pattern级别对应关系提交支持XML sitemap的形式,每个xml sitemap文件可包含1组或者多组pattern对应关系。格式说明如下:西安专业做网站公司,公司网页制作推荐阅读>>> 百度开启“轻舟”计划 免费快速架设移动站点,


  示例:  各URL字段可以被CDATA标记包含,如<![CDATA[url]]> 。

  <?xml version="1.0"encoding="UTF-8"?>

  <urlset>

  <!-- 表示news.163.com下的一组pattern对应关系-->

  <url>

  <loc><![CDATA[http://news.163.com/]]></loc>

  <data>

  <display>

  <pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>

  <xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>

  <wml_url_pattern ><![CDATA[http://wap.163.com/wml/page/ntes/${1}/${2}/${3}/${4}.wml]]></wml_url_pattern>

  </display>

  </data>

  </url>

  2、字段详细说明

  pc_url_pattern: 表示PC页pattern,在PC页url的基础上,首先确定url中哪些路径或参数是可替换的。然后根据其类型,使用正则匹配符号(\d+)或者(\w+)表示该路径或参数。(\d+)表示纯数字字符串,(\w+)表示数字或字母组成的字符串。

  xhtml_url_pattern / html5_url_pattern/ wml_url_pattern:表示xhtml/html5/wml版式的手机页pattern,在手机页url的基础上,根据可替换参数在对应的PC页pattern中出现的顺序,依次用${1},${2},……表示该参数。

  3、举例

  以网易的新闻页“漫游接电话移动也不要钱了”为例,其PC页url地址为http://news.163.com/09/1001/07/5KH8DE1F000120GR.html, 其对应的xhtml格式的手机页url地址为http://3g.163.com/news/09/1001/07/5KH8DE1F000120GR.html。

  步骤一:确定PC页中的可替换参数或者路径,得到其位置序号和类型。

  

  根据网站自身url的层次结构,其中09,1001,07和5KH8DE1F000120GR为动态可替换的路径。除5KH8DE1F000120GR为字母和数字混合外,其余均为纯数字。西安网站制作公司 那家好,西安建站推荐阅读>>> 百度要革自己的命移动搜索或取消PC网页收录,

  步骤二:根据可替换参数或路径的类型,得到PC页pattern (即sitemap中的pc_url_pattern)。

  使用正则匹配符号(\d+)或者(\w+)表示该路径或参数。(\d+)表示纯数字字符串,(\w+)表示数字或字母组成的字符串。

  

  步骤三:根据手机页url,以及可替换参数在步骤一中的位置序号,依次用${1},${2},……表示替换掉手机页url中的可替换参数或路径,得到手机页pattern。

  

  例子中,依次用${1},${2},${3}和${4}替换掉09,1001,07和5KH8DE1F000120GR,得到手机页pattern为http://3g.163.com/news/${1}/${2}/${3}/${4}.html。

  步骤四:根据手机页的页面类型,将手机页pattern写入对应的字段。各字段可以用CDATA标记包含,如<![CDATA[url]]> 。

  如示例中该pattern的手机页面为xhtml版式,将pattern http://3g.163.com/news/${1}/${2}/${3}/${4}.html 写入到xhtml_url_pattern字段中。

  最终得到sitemap文件如下:

  <?xml version="1.0"encoding="UTF-8"?>

  <urlset>

  <!—表示news.163.com下的一组pattern对应关系-->

  <url>

  <loc><![CDATA[http://news.163.com/]]></loc>

  <data>

  <display>

  <pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>

  <xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>

  <!-- 一组PC pattern可能含有多个版式的手机页pattern -->

  </display>

  </data>

  </url>

  <!-- 下一组pattern放在一个新的url节点内 -->

  </urlset>

  备注

  · 通过sitemap只能提交具有简单对应关系的pattern,也即,在PC页url与手机页路径或参数之间存在直接的对应关系,使得机器能根据PC页url按照一定的正则pattern自动计算出与其对应的手机页的url。如http://news.sina.com.cn/c/2012-05-27/235824487992.shtml和http://news.sina.cn/?sa=t124v71d6155414&amp;pos=102&vt=4虽然是对应的,但是从url本身很难找到联系,就不属于简单对应关系。

  · 正则匹配符号只支持(\d+)和(\w+),且不可嵌套使用,如(d+(\w+))这种形式不合法。域名中不可出现正则匹配符号。

  · pattern中,站长无需对特殊字符进行转义,例如不需要用\.代替. ,不需要用&amp;代替&。

  · pattern级别对应关系和url级别对应关系的sitemap格式不一样,请分别制作不同的文件并分开提交。

相关文章:

  • 随着人们将越来越多的时间放在手机上,以前只在电脑上才能完成的购物、聊天、信息获取等行为越来越倾向于移动手机上了。手机网民的增多,巨大的流量又会形成倒逼压力,让之前不关注...

  • 亲爱的网站管理员: 秉承用户至上的原则,百度移动搜索不断更新系统、升级算法,一切都为了让用户拥有更顺畅的搜索体验。百度移动搜索冰桶算法近期将升级至2.0版本。 2.0版本将严厉打击...

  • 亲爱的网站管理员: 秉承用户至上的原则,百度移动搜索不断更新系统、升级算法,一切都为了让用户拥有更顺畅的搜索体验。百度移动搜索冰桶算法近期将升级至3.0版本。3.0版本将严厉打击...

  • 亲爱的站长朋友们: 大家好!前段时间跟大家分享了关于百度移动搜索冰桶算法的情况,一期上线该算法后,我们发现大部分相关站点已经进行了调整,强制用户下载或全屏弹窗的情况得到了...

  • 百度对站点的收录不理想,导致站内搜索结果数太少? 收录不及时,导致最新的页面搜不到? 您可以在结果页管理的提升收录效果功能中提交数据,从而提升您的站内搜索收录时效性和覆盖率...

  • 下面介绍一些有关标记的例子及解释。 一、meta 标签分两大部分:HTTP 标题信息(http-equiv)和页面描述信息(name)。 1、http-equiv 属性的 Content-Type 值(显示字符集的设定) 说明:设定页面使用...

  • 百度转码声明中提到3个禁止百度转码的方法,对WordPress主题而言,最简单的就是在header.php文件中head/head标签内增加下面的一段代码: meta http-equiv=Cache-Control content=no-transform / 注:之前的 meta...

  • 随着移动设备不断的普及,人们正式步入了移动时代,那么作为一枚为互联网提供内容的站长朋友,如何保证自己和自己的网站在移动化来袭之时不被时代抛弃,不被我们的用户抛弃呢? 今天...

  • 1月21日百度站长平台微信公众帐号推出了有奖问答活动,将近400名同学完整地做完了8道与《百度搜索Mobile Friendly(移动友好度)标准V1.0》有关的选择题,但是完全答对的人并不多哦!今天学院...

  • 百度搜索是全球最大的中文搜索引擎。在移动互联时代,百度每天响应移动搜索请求高达几十亿次,导向互联网的流量几十亿量级,且快速增长。面对移动用户的迅猛崛起,站长们纷纷涌入移...

  • 公司:西安蟠龙网络科技有限公司
  • 联系人:张经理
  • 手机/微信:
  • Q Q: 点击这里给我发消息
  • 地址:西安市雁塔区唐延南路11号逸翠园i都会