PHP修剪非字母Unicode

我需要在 UTF-8 中修剪所有字符的字符串，除了来自任何语言的字母。对于早期测试，这工作正常，直到我开始使用 UTF-8 非拉丁字母：

<?PHP
$s = '\$5ı龢abc';
echo '<p>'.$s.'</p>';
while (!preg_match('/([\p{L}]+)/u',$s[0]))
{
 $s = substr($s,1);
 echo '<p>'.$s.'</p>';
}
?>

当前输出以下内容：

$5ı和abc

5ı和abc

ı和abc

�和abc

和abc

��abc

�abc

ABC

我希望最终输出为：ı龢abc。我不太确定我错过了什么？

使用单个字符索引不起作用，因为 PHP 不知道字符串中的“字符”，而只是索引字节。这显然是多字节字符的问题。但是无论如何你都做得太过手动了；只需替换all non-letter characters at the beginning of the string：

$s = preg_replace('/^\P{L}*/u','',$s);