在控制器上进行过滤以检查用户代理,然后根据结果是否为真进行重定向

问题描述

---------注意(编辑)- 我可能做的是完全错误的,如果实际上是错误的(对mvc来说是新的)

解决方案中,存在robots.txt文件来阻止该网站上的所有抓取工具。唯一的问题是,Facebook的抓取工具/抓取工具未遵循规则,仍在抓取/抓取网站,并导致每两分钟记录和发送电子邮件时出现错误。为此发送的错误是“在控制器'SolutionName.Web.Controllers.QuoteController'上找不到公共操作方法'Customer'。”

解决方案是在控制器上创建过滤器以检查代理名称。如果代理名称是针对Facebook的,则将其重定向到“无机器人认证页面”。过滤器必须位于控制器上,因为该站点提供3条不同的路由,其中​​的每条路由都有一个自定义链接,客户可以访问在Facebook上共享的直接链接(因此无法在路由配置中为此创建路由)。

我面临的问题是解决方案无法在控制器过滤器上立即重定向。它加入了Action方法(这些操作方法是Partial Pages),然后由于无法重定向而失败(然后该视图已经开始呈现-这是正确的)。 是否有一种方法在第一次访问此过滤器时立即重定向?还是有更好的解决方案?

要测试和解决故障,我正在更改代码中的用户代理以匹配记录的内容从过滤器重定向时发生错误:“不允许子操作执行重定向操作。”

由于Facebook的爬网程序而当前记录的错误“在控制器'SolutionName.Web.Controllers.QuoteController'上未找到公共操作方法'Customer'。”

堆栈跟踪中的用户代理:

enter image description here

这就是我所做的:

自定义过滤器:

    using System;
    using System.Collections.Generic;
    using System.Linq;
    using System.Reflection;
    using System.Web;
    using System.Web.Mvc;

    namespace SolutionName.Web.Classes
    {
        public class UserAgentActionFilterattribute : ActionFilterattribute
        {
            public override void OnActionExecuting(ActionExecutingContext filterContext)
            {
                try
                {
                    List<string> Crawlers = new List<string>()
                    {
                        "facebookexternalhit/1.1","facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.PHP)","facebookexternalhit/1.1","Facebot"
                     };

                     string userAgent = HttpContext.Current.Request.UserAgent.ToLower();
                     bool iscrawler = Crawlers.Exists(x => userAgent.Contains(x));
                     if (userAgent != null && iscrawler)
                     {
                        filterContext.Result = new RedirectResult("~/Home/norobotsAuthentication");
                        return;
                     }
            
                    base.OnActionExecuting(filterContext);

                 }
                 catch (Exception errException)
                 {
                    LogHelper.LogException(Severity.Error,errException);
                    SessionHelper.PolicyBase = null;
                    SessionHelper.ClearQuoteSession();
                    filterContext.Result = new RedirectResult("~/Home/norobotsAuthentication");
                    return;
                }
            }
        }
    }

norobotsAuthentication.cshtml:

@{
        ViewBag.PageTitle = "Robots not authorized";
        Layout = "~/Views/Shared/_LayoutClean2.cshtml";
 }

 <div class="container body-content">
     <div class="row">
    <div class="col-lg-12 col-md-12 col-sm-12 col-xs-12 container-solid">
        <div class="form-horizontal">
            <h3>@ViewBag.NotAuthorized</h3>
        </div>
    </div>
</div>

没有机器人的操作方法

    #region Bot Detection
    public ActionResult norobotsAuthentication()
    {
        ViewBag.NotAuthorized = "Robots / Scrapers not authorized!";
        return View();
    }

    #endregion

我要检查的控制器之一:

    namespace SolutionName.Web.Controllers
    {
        [UserAgentActionFilter]
        public class QuoteController : Controller
        {

            public ActionResult Customer()
            { //Some logic }
        }
    }

分页面操作结果,在运行过滤器时发生错误

    public ActionResult _Sidebar()
    {
        var model = SessionHelper.PolicyBase;
        return PartialView("_Sidebar",model);
    }

解决方法

这是因为您使用的是ActionFilterAttribute。如果您在此处查看文档:{​​{3}},它说明了过滤器的生命周期,并且基本上-到您到达动作过滤器时,为时已晚。您需要授权过滤器或资源过滤器,以使请求短路。

每种过滤器类型在过滤器的不同阶段执行 管道:

授权过滤器

  • 授权过滤器首先运行,用于确定用户是否获得请求授权。
  • 如果请求未被授权,授权过滤器将使管道短路。

资源过滤器

  • 授权后运行。
  • OnResourceExecuting在其余过滤器管道之前运行代码。例如,OnResourceExecuting在模型绑定之前运行代码。
  • OnResourceExecuted在其余部分之后运行代码 管道已经完成。

以下示例摘自文档,它是资源过滤器的实现。大概可以通过授权过滤器实现类似的实现,但是我认为在授权过滤器失败后返回有效的Http状态代码可能有点反模式。

// See that it's implementing IResourceFilter
public class ShortCircuitingResourceFilterAttribute : Attribute,IResourceFilter
{
    public void OnResourceExecuting(ResourceExecutingContext context)
    {
        context.Result = new ContentResult()
        {
            Content = "Resource unavailable - header not set."
        };
    }

    public void OnResourceExecuted(ResourceExecutedContext context)
    {
    }
}

我试图将其与您提供的内容合并-请注意,这可能开箱即用。

public class ShortCircuitingResourceFilterAttribute : Attribute,IResourceFilter
{
    public void OnResourceExecuting(ResourceExecutingContext context)
    {
        try
        {
            // You had duplicates in your list,try to use Hashset for .Contains methods
            var crawlerSet = new Hashset<string>()
            {
               "facebookexternalhit/1.1","facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)","Facebot"
            };
                    
            string userAgent = HttpContext.Current.Request.UserAgent;
            // You're unnecessarily and incorrectly checking if the userAgent is null multiple times
            // if it's null it'll fail when you're .ToLower()'ing it. 
            if (!string.IsNullOrEmpty(userAgent) && crawlerSet.Contains(userAgent.ToLower()))
            {
                // Some crawler
                context.Result = new RedirectResult("~/Home/NoRobotsAuthentication");
            }
         }
         catch (Exception errException)
         {
            LogHelper.LogException(Severity.Error,errException);
            SessionHelper.PolicyBase = null;
            SessionHelper.ClearQuoteSession();
            context.Result = new RedirectResult("~/Home/NoRobotsAuthentication");
         }
    }

    public void OnResourceExecuted(ResourceExecutedContext context)
    {
    }
}