问题描述
||
我有一个正则表达式来验证字符串。但是现在我想删除所有与我的正则表达式不匹配的字符。
例如。
regExpression = @\"^([\\w\\\'\\-\\+])\"
text = \"This is a sample text with some invalid characters -+%&()=?\";
//Remove characters that do not match regExp.
result = \"This is a sample text with some invalid characters -+\";
关于如何使用RegExpression确定有效字符并删除所有其他字符的任何想法。
非常感谢
解决方法
我相信您可以在一行中做到这一点(将白名单字符并替换所有其他字符):
var result = Regex.Replace(text,@\"[^\\w\\s\\-\\+]\",\"\");
从技术上讲,它将产生以下结果:
\“这是带有一些无效字符的示例文本-+ \”
这与您的示例稍有不同(-和+之间的多余空格)。
, 就那么简单:
var match = Regex.Match(text,regExpression);
string result = \"\";
if(match.Success)
result = match.Value;
删除不匹配的字符与保留匹配的字符相同。这就是我们在这里所做的。
如果表达式在文本中可能多次匹配,则可以使用以下命令:
var result = Regex.Matches(text,regExpression).Cast<Match>()
.Aggregate(\"\",(s,e) => s + e.Value,s => s);
, 感谢替换字符(如果不匹配),我创建了一个辅助方法来去除不可接受的字符。
允许的格式应为Regex格式,并期望将其包装在方括号中。一个功能将在打开方括号后插入波浪号。
我希望它不适用于所有描述有效字符集的RegEx,但它适用于我们正在使用的相对简单的字符集。
/// <summary>
/// Replaces not expected characters.
/// </summary>
/// <param name=\"text\"> The text.</param>
/// <param name=\"allowedPattern\"> The allowed pattern in Regex format,expect them wrapped in brackets</param>
/// <param name=\"replacement\"> The replacement.</param>
/// <returns></returns>
/// // https://stackoverflow.com/questions/4460290/replace-chars-if-not-match.
//https://stackoverflow.com/questions/6154426/replace-remove-characters-that-do-not-match-the-regular-expression-net
//[^ ] at the start of a character class negates it - it matches characters not in the class.
//Replace/Remove characters that do not match the Regular Expression
static public string ReplaceNotExpectedCharacters( this string text,string allowedPattern,string replacement )
{
allowedPattern = allowedPattern.StripBrackets( \"[\",\"]\" );
//[^ ] at the start of a character class negates it - it matches characters not in the class.
var result = Regex .Replace(text,@\"[^\" + allowedPattern + \"]\",replacement);
return result;
}
static public string RemoveNonAlphanumericCharacters( this string text)
{
var result = text.ReplaceNotExpectedCharacters(NonAlphaNumericCharacters,\"\" );
return result;
}
public const string NonAlphaNumericCharacters = \"[a-zA-Z0-9]\";