javascript – 我想从公共Facebook墙上的帖子中获取数据

是否有人抓取或使用FB API访问公共资料的墙上帖子中的数据?如果您只是转到URL,您可以检查元素以查看大部分数据以及墙上无限滚动的ajax调用.

你我怎么去完成这个?

以下帖子没有得到回答,或者只是不同的情况但是很接近:

> Get wall feed from a public Facebook page using Graph API – is it really this complex?
> Displaying Facebook posts to non-Facebook users
> How to show facebook feed messages from my site without access_token?
> How to get public wall posts with the facebook API

作为我想要完成的一个例子,这个公开个人资料https://www.facebook.com/aurelia.filion一个2013年11月21日的墙贴,我假设想从中获取数据.怎么办?

解决方法

FaceBook已经关闭了你可以从API中获取的大部分数据.除非你是朋友,否则它只限于他们的姓名,用户名,语言环境,如果我没记错性别.这些是认设置.如果他们特意选择分享更多(一般的应用程序,这是非常少的人),将有更多的信息.

我认为要获得帖子,您需要该人允许您的应用(开发者ID)访问他们的帖子.

至于刮擦.你可以做到这一点,但FB再次明智.在向您展示验证码之前,您可以抓取大约1,000-2,000页.然后,您还需要多个帐户和代理.

首先,您需要CURL.我推荐PHP的以下内容

http://semlabs.co.uk/journal/object-oriented-curl-class-with-multi-threading

http://semlabs.co.uk/journal/multi-threaded-stack-class-for-php

那里有基本的例子.我相信我的历史记录中有一些关于登录的帖子.报废非常简单.我更喜欢RegEx从页面获取详细信息:

preg_match_all( '~<div.*? class="this-data".*?>(.*?)<\/div>~is',$page,$mats );

相关文章

前言 做过web项目开发的人对layer弹层组件肯定不陌生,作为l...
前言 前端表单校验是过滤无效数据、假数据、有毒数据的第一步...
前言 图片上传是web项目常见的需求,我基于之前的博客的代码...
前言 导出Excel文件这个功能,通常都是在后端实现返回前端一...
前言 众所周知,js是单线程的,从上往下,从左往右依次执行,...
前言 项目开发中,我们可能会碰到这样的需求:select标签,禁...