用Ruby控制Tor客户端

我正在编写一个 Ruby脚本,它自动抓取网站进行数据分析,现在我有一个相当复杂的要求:我必须能够模拟来自各个国家的访问,大约20个不同的国家.网站将根据IP位置包含不同的信息,因此完成此任务的唯一方法是从实际位于该国家/地区的服务器请求它.

由于我不想在这20个国家的每一个国家购买服务器,我选择试试Tor – 正如许多人所知,通过编辑torrc配置文件,可以指定退出节点,因此可以指定国家/地区.实际请求将来自哪个.

当我手动执行此操作时,例如通过编辑torrc文件以使用阿根廷服务器,然后使用Vidalia断开Tor,重新连接Vidalia,然后重新运行请求,它工作正常.但是,我想完全自动化这个过程,并尽可能高效地完成. Tor是用C语言编写的,我想避免拆分它的整个源代码.知道什么是仅使用Ruby自动化整个过程的最简单方法

此外,如果我遗漏了一些东西,并且有一个更简单的替代方案来解决这个问题,请告诉我.

谢谢!

解决方法

请看一下Tor控制协议.您可以使用telnet控制电路.
http://thesprawl.org/memdump/?entry=8

要切换到切换到新端点的新电路:

require 'net/telnet'

  def switch_endpoint
    localhost = Net::Telnet::new("Host" => "localhost","Port" => "9051","Timeout" => 10,"Prompt" => /250 OK\n/)
    localhost.cmd('AUTHENTICATE ""') { |c| print c; throw "Cannot authenticate to Tor" if c != "250 OK\n" }
    localhost.cmd('signal NEWNYM') { |c| print c; throw "Cannot switch Tor to new route" if c != "250 OK\n" }
    localhost.close
  end

请注意制作新电路的延迟,可能需要几秒钟,因此您最好在代码添加延迟,或通过调用某个远程IP检测站点来检查您的地址是否已更改.

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...