使用正则表达式实现像SQL中LIKE语句中的%和_通配

在项目中我们经常遇到将数据库的数据取到后再次进行筛选过滤的情况。LINQ to Entity提供了统一的查询接口并且可以高效的完成工作,但是对于我们常在SQL中使用的%和_这样的通配符并没有支持。我们只能通过String.Contains方法来实现简单的通配。使用String.Contains方法是无法达到在查询串中使用通配符的目的的。正则表达式虽然晦涩难懂,但功能十分强大,解决个统配符绰绰有余。

代码如下:

publicstaticclassLINQHelper
{
///<summary>
///Theallregexmetachars
///</summary>
privatestaticstring[]REGEX_META_CHARS={"\\",".","^","$","*","+","?","{","}","(",")","[","]"};

///<summary>
///LikemethodworkasSQLlike
///</summary>
///<paramname="searchString">Thesearchstring</param>
///<paramname="sqlPattern">TheSQLpattern</param>
///<returns>Whethermatchornot</returns>
publicstaticboolLike(thisstringsearchString,stringsqlPattern)
{
if(searchString==null)
{
returnfalse;
}
else
{
stringconvertedPattern=EscapeRegexMetaChars(sqlPattern).Replace("_",".").Replace("%",".*");
convertedPattern=String.Format("^{0}$",convertedPattern);

returnRegex.IsMatch(searchString,convertedPattern,RegexOptions.Singleline);
}
}

///<summary>
///LikemethodworkasSQLlike
///</summary>
///<paramname="searchString">Thesearchstring</param>
///<paramname="sqlPattern">TheSQLpattern</param>
///<paramname="escapeChar">Theescapechar</param>
///<returns>Whethermatchornot</returns>
publicstaticboolLike(thisstringsearchString,stringsqlPattern,charescapeChar)
{
if(searchString==null)
{
returnfalse;
}
else
{
stringconvertedPattern=EscapeRegexMetaChars(sqlPattern);
convertedPattern=ReplaceWildcards(convertedPattern,'_',escapeChar);
convertedPattern=ReplaceWildcards(convertedPattern,'%',".*",escapeChar);
convertedPattern=String.Format("^{0}$",RegexOptions.Singleline);
}
}

///<summary>
///Replacewildcards
///</summary>
///<paramname="replacement">Thereplacementstring</param>
///<paramname="wildcard">Thewildcard</param>
///<paramname="replaceTo">Thereplacewildcharto</param>
///<paramname="escapeChar">Theescapechar</param>
///<returns>Theconvertedsearchvalue</returns>
privatestaticstringReplaceWildcards(stringreplacement,charwildcard,stringreplaceTo,charescapeChar)
{
stringregexExpression=String.Format("(^|[^{0}])({1}+)",escapeChar,wildcard);
returnRegex.Replace(replacement,regexExpression,match=>String.Format("{0}{1}",match.Groups[1].Value,match.Groups[2].Value.Replace(wildcard.ToString(),replaceTo)))
.Replace(string.Format("{0}{1}",wildcard),wildcard.ToString());
}

///<summary>
///Escaperegexmetachars
///</summary>
///<paramname="replacement">Thereplacementstring</param>
///<returns>Theconvertedsearchvalue</returns>
privatestaticstringEscapeRegexMetaChars(stringreplacement)
{
stringresultString=replacement;
foreach(stringmetaCharinREGEX_META_CHARS)
{
resultString=resultString.Replace(metaChar,string.Format(@"\{0}",metaChar));
}

returnresultString;
}
}

首先,要将查询串中所有正则表达式的元字符转义为普通字符,这样才能安全的使用正则表达式进行匹配。

然后,将”_”和”%”替换成相应的正则表达式,即”_”替换成”.”,”%”替换成”.*”。这里还考虑到SQL的LIKE语句也有转义符功能,即如果使用ESCAPE子句则LIKE串中转义符后的”_”和”%”变为普通字符而不是通配符。所以当使用转义符时处理如下:

  • 将所有不以转义符引导的通配符替换。

  • 再将转义符引导的通配符的转义符去掉,即将通配符转义为普通字符。

以下是几个转换的例子:

  • LIKE ‘A_B’ 转换为 A.B

  • LIKE ‘A%B’ 转换为 A.*B

  • LIKE ‘A~_B’ ESCAPE ‘~’ 转换为 A_B

  • LIKE ‘A.B’ 转换为 A/.B

优点:我们可以在LINQ语句的条件中方便的使用Like方法去过滤数据,LINQ语句整体上会保持很好的可读性。

缺点:Like 方法会被调用n次(n取决于数据量),解析SQL pattern到正则表达式pattern的代码就要被重复执行n次。因此当数据量过大时解析pattern会消耗一定的资源。当然这可以通过一些方法去解决,如缓存解析结果,或改为传入就是解析好的正则表达式等。

相关文章

jquery.validate使用攻略(表单校验) 目录 jquery.validate...
/\s+/g和/\s/g的区别 正则表达式/\s+/g...
自整理几个jquery.Validate验证正则: 1. 只能输入数字和字母...
this.optional(element)的用法 this.optional(element)是jqu...
jQuery.validate 表单动态验证 实际上jQuery.validate提供了...
自定义验证之这能输入数字(包括小数 负数 ) &lt;script ...