400-685-0732 电话咨询送星巴克礼品
上海 · 北京 · 南京 · 广州 · 昆山 · 伦敦
关注专业seo外包公司
SEO创新会
文军营销 中国靠谱的数字营销公司

Sitemap终极奥义(二)-档案的位置和交叉提交

首页  >   整站优化  > SEO整站优化  >  Sitemap终极奥义(二)-档案的位置和交叉提交

接着上文,一般在站内优化的过程中,sitemap的位置都是直接放在网站的根服务器下的。例如 http://www.example.com/sitemap.xml下的sitemap就不可包含來自 http://subdomain.example.com 的 URL。但如果使用的是端口的路径,就也需要把端口的号作为路径中的一部分,包含在所有的sitemap的各个URL路径中,比如如果网站是http://www.example.com:100/,则sitemap列明的URL则都必须以具有100端口号的URL为开头。

在一定的情况下,某些公司因为更新权限等安全策略的问题,也许给操作人员就一定的目录层级下的权限。比如说,如果我有权限变更http://example.com/path/的URL资讯,而这个时候的sitemap也位于http://example.com/path/sitemap.xml下。在其中被归纳为有效的URL就应该类似于http://example.com/path/show?item=23,http://example.com/path/show?item=233&user=3453等,其中无效的举例为:http://example.com/image/show?item=23(跨目录),https://example.com/catalog/page1.html(https://通讯协议不标准)。

交叉提交

交叉提交的意义在什么地方,搜索了一下,对于为什么要这么做的技术文档十分少,查阅到可信服的:当一个站点的二级域名数量达到一个相当大的值的时候,不可能为每一个站点去做sitemap提交的,验证每一个站点的所有权,所以就有意义用到交叉提交了。这一点和我猜想的差不多,就是便于管理,而现在的百度站长平台就不是每一个验证的站点都能做sitemap提交的,目前这个功能还不对所有的站点都开放。所以就可以用有提交权限的站点做这件事情了,HOHO。

比如说手上有3个站点,一个主站,两个二级域名,分别的域名和对应的sitemap文件名为:
www.mainhost.com,Sitemap 文件 sitemap-mainhost.xml
www.host1.com,Sitemap 文件sitemap-host1.xml
www.host2.com,Sitemap 文件sitemap-host2.xml

将所有的sitemap放在拥有提交权限的站点下,即:

http://www.mainhost.com/sitemap-mainhost.xml

http://www.mainhost.com/sitemap-host1.xml

http://www.mainhost.com/sitemap-host2.xml

然后通过修改www.host1.com和www.host2.com的robots.txt文档,将其指向www.mainhost.com中的sitemap,就可以间接证明拥有这2个站点的所有权。这个时候就可以通过主站提交所有的sitemap了。

让搜索引擎知道我们的sitemap

3种方式,前2种是我们现在常用的。第一种是大家耳熟能详的站长工具的提交页面提交sitemap,第二种就是robot.txt中指定位置,为此,添加下列行:Sitemap: http://www.example.com/sitemap.xml。此指令不受 user-agent 行的影响,因此可放在文件中的任意位置,不过一般我们放在末尾,没什么讲究。

最后种用HTTP请求的方式,要和服务器的知识有些关联,我也不会,所以不赘述,直接粘贴过来,有兴趣的请自己研究。

通过 HTTP 请求提交 Sitemap
要使用 HTTP 请求提交 Sitemap(使用搜索引擎提供的网址替换 <searchengine_URL>),请将请求发送到下列网址:
<searchengine_URL>/ping?sitemap=sitemap_url
例如,如果 Sitemap 位于http://www.example.com/sitemap.gz,则网址将变为:
<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz
网址编码 /ping?sitemap=: 之后的所有内容
<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz

您可以使用 wget、curl 或其他您选择的机制发出 HTTP 请求。请求成功的话会返回 HTTP 200 回应代码;如果收到其他回应,则应重新提交请求。HTTP 200 回应代码仅表示搜索引擎已收到您的 Sitemap,并不表示 Sitemap 本身或其中包含的网址有效。完成此操作的简单方法是设置自动执行的任务,定期生成并提交 Sitemap。

copyright@2015 上海文军信息技术有限公司 沪ICP备10034044号-8 网站地图