问题描述
注意:这与站点地图的工作原理或站点地图结构的外观无关,也不是与 SEO 相关的问题。
我的域 mysite.com 和 mysite.pt 是同一站点的 2 种语言版本(EN、PT)。 内容通过数据库驱动的 CMS 动态添加/删除。
每个菜单/类别更新都会创建其特定语言的路由,例如:mysite.com/beach 和 mysite.pt/praia,其中都创建了一个指向相同的控制器,例如site_manager/page/beaches
。
每个语言版本的代码库都是相同的,因此所有语言版本只有一个 /application、/assets 和 /system 文件夹。
language specific content 通过 <?=$this->lang->line('my_token1')?>
文件系统如下:
/public_html
/mysite.com/index.PHP
/mysite.pt/index.PHP
/all_sites/application
/all_sites/assets
/all_sites/system
两个站点的路由目录changes system and application folder location中的index.PHP文件:
$system_path = '/home/my_host/public_html/all_sites/system';
$application_folder = '/home/my_host/public_html/all_sites/application';
此设置运行顺利。 但是 CMS 很旧,并且不会在菜单或内容更改时创建更新的站点地图。
所以我想了另一种方法来提供更新的网站/语言特定的 sitemap.xml
:
当机器人来扫描站点时,可以即时创建站点地图并为机器人提供最新的 sitemap.xml
我通过创建一个控制器方法 site_manager/sitemap()
来解决这个问题,该方法解析数据库条目并输出带有 echo $this->load->view('sitemap',$data,true);
的站点地图
<!-- created by mysite.pt,2020-12-22 -->
<url>
<loc>https:// mysite.pt/</loc>
<lastmod>2020-12-22T20:53:36+00:00</lastmod>
<priority>1.00</priority>
</url>
<url>
<loc>https:// mysite.pt/praias.html</loc>
<lastmod>2020-12-22T19:51:51+00:00</lastmod>
<priority>0.80</priority>
</url>
或
<!-- created by mysite.com,2020-12-22 -->
<url>
<loc>https:// mysite.com/</loc>
<lastmod>2020-12-22T20:53:36+00:00</lastmod>
<priority>1.00</priority>
</url>
<url>
<loc>https:// mysite.com/beaches.html</loc>
<lastmod>2020-12-22T19:51:51+00:00</lastmod>
<priority>0.80</priority>
</url>
问题: 这个设置的问题是我在根目录中不会有任何 sitemap.xml,因为一旦使用了控制器功能,就只有一个回显输出。机器人会空手而归,因为没有找到任何 sitemap.xml,如果你输入 mysite.com/sitemap.xml 也是一样。
解决方法
机器人正在网站根目录中寻找 sitemap.xml
。
为了让机器人“读取”控制器的回显输出,它需要被定向到控制器函数,在我们的例子中是 site_manager/sitemap()
。
诀窍是将 .htaccess 重定向到创建站点地图输出的控制器,注意 site_manager
在 routes.php 中设置为默认控制器:
将 sitemap.xml 重定向到 sitemap.php
RewriteRule ^sitemap\.xml$ sitemap.php [L]
这意味着试图读取“非现有站点地图.xml”的机器人被重定向到控制器并通过echo $this->load->view('sitemap',$data,true);
动态站点地图数据的输出,尽可能获取最新的站点地图 xml 数据。
您可以测试是否成功创建站点地图,例如打字https://mysite.pt/sitemap.xml
在浏览器中:
注意:您不会在 ftp://mysite.pt
的 ftp 目录列表中找到上面创建的 sitemap.xml 文件! ,因为此文件从未写入或上传过。
您还可以通过谷歌、必应等市长目录列表的搜索控制台进行验证,并确认绕过机器人是否成功提交了站点地图