问题描述
我正在创建一个内部perl或php程序,(最好)将使用“ get($ url)”的某些变体或等效形式来获取我的Facebook“关于”页面的源代码。我们的目标是从该页面上吸引其他25个关注者,并提供喜欢和关注者的总数。
我的问题是获取正确的源代码/屏幕信息。如果在浏览器中查看任何Facebook页面,则单击鼠标右键,然后单击“查看源代码” 实际上,喜欢和关注者是嵌入在人看到的源代码中的,例如:
... n“,” follower_count“:1599,”...。 {“ global_likers_count”:1602},“ friends_who
但是,如果将Perl“ get($ url)”命令作为Perl脚本的一部分进行, 捕获的源代码不包含这些变量,可能是因为它们是动态生成的。重要提示:同样,您将在源代码中手动执行此操作,这并不是最终通过任何标准“ get”命令或SCREEN SCRAPE所捕获的内容。
因此,问题是:“如何以某种方式抓取网页的源代码,使其包含为屏幕数据生成的动态内容,以便我可以对其进行操作?换句话说,源代码不是那么多页面本身的代码,但是屏幕上显示的内容的源代码?” (我尝试过
过去,我是在不包含动态内容的页面上完成此操作的。
我尝试了许多在论坛上找到的建议,包括基本的
use LWP::Simple;
$url = 'https://www.facebook.com/welovesaipan/about';
$content = get($url);
以及
$cookie_jar = HTTP::Cookies->new;
$browser = LWP::UserAgent->new;
$browser->cookie_jar($cookie_jar);
以及 TreeBuilder,STDOUT到log.txt,getprint($ url)和其他选项
仅供参考:然后我将两个字符串定义为splitoffleft和splitoffright,然后 在拆分命令中使用以消除我要查找的源代码字符串左侧和右侧的所有内容(即follower_count“:1599,”)
($discardleft,$keepright) = split($splitoffleft,$content);
($discardright,$followers) = split($splitoffright,$keepright);
同样,一旦我获得了REAL源代码,就可以将其保存到文件中并根据需要进行操作。有人可以帮忙吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)