xss 使用斜杠字符绕过正则表达式

问题描述

我想了解为什么 / 字符可用于绕过某些正则表达式 xss 过滤器。 例如,让我们采用最常见的攻击媒介之一 <svg/onload=alert(1)>。谁能解释为什么使用斜杠而不是空格字符起作用的原因?从我正在研究的资源来看,它说向量可以绕过这个正则表达式 (on\w+\s*=) 但我不明白为什么。这可能看起来是一个微不足道的问题,但我一直在四处寻找,但找不到任何与此问题的根本原因相关的内容

解决方法

它在 RegEx 类似于 <\w+ (on\w+\s*=.*) 时有效。我们可以看到,当 on 关键字前有空格时,它会阻止 XSS,因此使用 / 将绕过此 RegEx 检查。某些 RegEx 将 / 视为标记名称的一部分。嗯,这完全取决于 RegEx,但我们知道通常 on 事件在空格之后开始,因此大多数开发人员假设 on 事件之前有一个空格,并相应地制作 RegEx,可以使用 / 绕过它。