从HTML提取宽度或高度高于指定值-Regex的所有图像

问题描述

|| 我正在尝试与LinkedIn或Facebook之类的Classic ASP进行小型链接共享功能。 我需要做的是获取远程URL的HTML并提取所有宽度大于50px的图像。 我可以抓取并获取HTML,也可以使用此正则表达式查找图像:
<img([^<>+]*)>
它匹配;
<img src=\"/images/icon.jpg\" width=\"60\" height=\"90\" style=\"display:none\"/>
然后,我可以提取路径,但有时它与不是真实图像的
<img src=\"/track.PHP\" style=\"display:none\" width=\"1\" height=\"1\"/>
匹配。 无论如何,我觉得您会因为经典的ASP而生气,但是我的公司.... 我知道有很多关于此问题的主题,并且大多数情况下,他们建议不要使用regex,但我无法通过经典的asp找到解决方法。是否有组件或东西? 问候     

解决方法

        这将使您接近:
<img [^>]*width=\"(0?[1-9]\\d{2,}|[5-9]\\d)\"[^>]*>
它接受宽度为50或更大的图像标签。 编辑:宽度未指定的标签:
<img [^>]*width=\"(0?[1-9]\\d{2,}|[5-9]\\d)\"[^>]*>|<img ((?!width=)[^>])*>
    

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...