问题描述
||
我正在尝试与LinkedIn或Facebook之类的Classic ASP进行小型链接共享功能。
我需要做的是获取远程URL的HTML并提取所有宽度大于50px的图像。
我可以抓取并获取HTML,也可以使用此正则表达式查找图像:
<img([^<>+]*)>
它匹配; <img src=\"/images/icon.jpg\" width=\"60\" height=\"90\" style=\"display:none\"/>
然后,我可以提取路径,但有时它与不是真实图像的<img src=\"/track.PHP\" style=\"display:none\" width=\"1\" height=\"1\"/>
匹配。
无论如何,我觉得您会因为经典的ASP而生气,但是我的公司....
我知道有很多关于此问题的主题,并且大多数情况下,他们建议不要使用regex,但我无法通过经典的asp找到解决方法。是否有组件或东西?
问候
解决方法
这将使您接近:
<img [^>]*width=\"(0?[1-9]\\d{2,}|[5-9]\\d)\"[^>]*>
它接受宽度为50或更大的图像标签。
编辑:宽度未指定的标签:
<img [^>]*width=\"(0?[1-9]\\d{2,}|[5-9]\\d)\"[^>]*>|<img ((?!width=)[^>])*>