以编程方式为多语言/多域站点动态创建 sitemap.xml

问题描述

注意:这与站点地图的工作原理或站点地图结构的外观无关,也不是与 SEO 相关的问题。

我的域 mysite.commysite.pt 是同一站点的 2 种语言版本(EN、PT)。 内容通过数据库驱动的 CMS 动态添加/删除

每个菜单/类别更新都会创建其特定语言的路由,例如:mysite.com/beachmysite.pt/praia,其中都创建了一个指向相同的控制器,例如site_manager/page/beaches

每个语言版本的代码库都是相同的,因此所有语言版本只有一个 /application、/assets 和 /system 文件夹。 language specific content 通过 <?=$this->lang->line('my_token1')?>

加载

文件系统如下:

/public_html
    /mysite.com/index.PHP
    /mysite.pt/index.PHP
    /all_sites/application
    /all_sites/assets
    /all_sites/system

两个站点的路由目录changes system and application folder location中的index.PHP文件

$system_path = '/home/my_host/public_html/all_sites/system';
$application_folder = '/home/my_host/public_html/all_sites/application';

此设置运行顺利。 但是 CMS 很旧,并且不会在菜单内容更改时创建更新的站点地图。

所以我想了另一种方法来提供更新的网站/语言特定的 sitemap.xml: 当机器人来扫描站点时,可以即时创建站点地图并为机器人提供最新的 sitemap.xml

我通过创建一个控制器方法 site_manager/sitemap()解决这个问题,该方法解析数据库条目并输出带有 echo $this->load->view('sitemap',$data,true);站点地图

哪个输出,取决于站点

<!-- created by mysite.pt,2020-12-22 -->
<url>
  <loc>https:// mysite.pt/</loc>
  <lastmod>2020-12-22T20:53:36+00:00</lastmod>
  <priority>1.00</priority>
</url>
<url>
  <loc>https:// mysite.pt/praias.html</loc>
  <lastmod>2020-12-22T19:51:51+00:00</lastmod>
  <priority>0.80</priority>
</url>

<!-- created by mysite.com,2020-12-22 -->
<url>
  <loc>https:// mysite.com/</loc>
  <lastmod>2020-12-22T20:53:36+00:00</lastmod>
  <priority>1.00</priority>
</url>
<url>
  <loc>https:// mysite.com/beaches.html</loc>
  <lastmod>2020-12-22T19:51:51+00:00</lastmod>
  <priority>0.80</priority>
</url>

问题: 这个设置的问题是我在根目录中不会有任何 sitemap.xml,因为一旦使用了控制器功能,就只有一个回显输出。机器人会空手而归,因为没有找到任何 sitemap.xml,如果你输入 mysite.com/sitemap.xml 也是一样。

如何让机器人访问控制器方法并因此读取生成输出

解决方法

机器人正在网站根目录中寻找 sitemap.xml

为了让机器人“读取”控制器的回显输出,它需要被定向到控制器函数,在我们的例子中是 site_manager/sitemap()

诀窍是将 .htaccess 重定向到创建站点地图输出的控制器,注意 site_manager 在 routes.php 中设置为默认控制器:

将 sitemap.xml 重定向到 sitemap.php

RewriteRule ^sitemap\.xml$ sitemap.php [L]

这意味着试图读取“非现有站点地图.xml”的机器人被重定向到控制器并通过echo $this->load->view('sitemap',$data,true); 动态站点地图数据的输出,尽可能获取最新的站点地图 xml 数据。

您可以测试是否成功创建站点地图,例如打字https://mysite.pt/sitemap.xml 在浏览器中:

注意:您不会在 ftp://mysite.pt 的 ftp 目录列表中找到上面创建的 sitemap.xml 文件! ,因为此文件从未写入或上传过。

您还可以通过谷歌、必应等市长目录列表的搜索控制台进行验证,并确认绕过机器人是否成功提交了站点地图

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...