php – 匹配“img”标记和“alt”标记和行号之间的字符串

我试图从下面的行中获取“img”标记结束和关闭“a”标记间的字符串(你好,我来自img标记之后).

<a href="products.html><img src="image.jpg"  alt="alt value">hello i am from after img tag</a>

然后检查它们是否匹配.同时我想找出该行的编号.
我尝试了以下代码,它给出了行号和网页行.

        $dom = new domDocument;
        $dom->loadHTMLFile('http://www.google.com');
        $dom->preserveWhiteSpace = true;
        $dom->formatOutput = true;
        $new = htmlspecialchars($dom->saveHTML(), ENT_QUOTES);
        $lines = preg_split('/\r\n|\r|\n/', $new);
        foreach ($lines as $lineNumber => $line) {
         echo $lineNumber . \r\r. $line;
        }

以下代码为我提供了图像源和alt标记.我无法获得“img”标签结束和关闭“a”标签间的行号或文本(你好我来自img标签).

$alts = array();
$tags = $dom->getElementsByTagName('img');
foreach($tags as $tag) {
    $alts[$tag->attributes->getNamedItem('src')->nodeValue] 
            = $tag->attributes->getNamedItem('alt')->nodeValue;
}
foreach($alts as $key => $alt) {
    echo "{$key} => {$alt}<br/>";
}

我知道regexp不适用于html解析,但我也尝试过,看看它是否适用于以下行.
    $alt =’你好,我来自img
    标签
我有的正则表达式是,
// alt里面的任何东西

preg_match_all('|\s*alt[^>]*=[\'"](.*?)[\'"]|i', $alt, $altTag);

//“img”标签结束和关闭“a”标签间的任何内容.

preg_match_all("#<\s*a[^>]*><\s*img[^>]*>(.*?)<\s*/\s*a>#s", $alt, $foo);

它的工作方式非常完美,但是当尝试在变量$line上使用相同的regExp时(从上面的代码中)它就没有给我任何东西.
谁能帮帮我吗.我真的需要做这个工作.谢谢

解决方法:

试试吧

$str = '<a href="products.html><img src="image.jpg"  alt="alt value">hello i am from after img tag</a>';
preg_match_all('#<a[^>]+>(.*)</a>#isU', $str, $match);
$result = array_map('strip_tags', $match[1]);
print_r($result);

相关文章

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
前言 之前做了微信登录,所以总结一下微信授权登录并获取用户...
FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一...
之前公司需要一个内部的通讯软件,就叫我做一个。通讯软件嘛...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...