代理ip软件

您的位置: 首页 > 新闻资讯 > 正文

如何通过requests使用代理IP进行爬虫工作

发布时间:2019-07-02 15:37:44 来源:挂机精灵

  如何通过requests使用代理IP进行爬虫工作?我们知道,一些网站会有相应的反爬虫措施,比如检测某些IP的访问次数或者访问频率,有些反人类的访问速度就会收到限制甚至封禁,所以在进行爬虫工作时也要讲究策略,比如使用代理IP,调整访问频率,设置UA等等,让我们来看看如何简单的使用代理IP。

如何通过requests使用代理IP进行爬虫工作

  #!/usr/bin/env python

  # -*- coding:utf-8 -*-

  import requests

  import random

  if __name__ == "__main__":

  #不同浏览器的UA

  header_list = [

  # 遨游

  {"user-agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)"},

  # 火狐

  {"user-agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"},

  # 谷歌

  {

  "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}

  ]

  #不同的代理IP(该代理ip可能已经失效,请自行去挂机精灵网站上购买开通)

  proxy_list = [

  {"http": "112.115.57.20:33128"},

  {‘http‘: ‘121.41.171.223:32128‘}

  ]

  #随机获取UA和代理IP

  header = random.choice(header_list)

  proxy = random.choice(proxy_list)

  url = ‘http://www.baidu.com/s?ie=UTF-8&wd=ip‘

  #参数3:设置代理

  response = requests.get(url=url,headers=header,proxies=proxy)

  response.encoding = ‘utf-8‘

  with open(‘daili.html‘, ‘wb‘) as fp:

  fp.write(response.content)

  #切换成原来的IP

  requests.get(url, proxies={"http": ""})


相关资讯

如何通过隐藏IP来防御DDOS攻击

如何通过隐藏IP来防御DDOS攻击?现在这个互联网环境很难保证自己不会被DDOS攻击,为了保证服务器的正常稳定运行,隐藏服务器真实IP是个不错的方法,这可以让攻

来源:互联网

2019-04-10 16:27:03

怎么通过隐藏服务器真实IP来防御DDOS攻击

现在这个互联网环境很难保证自己不会被DDOS攻击,为了保证服务器的正常稳定运行,隐藏服务器真实IP是个不错的方法,这可以让攻击者找不到攻击目标,从而有效地保护网

来源:互联网

2019-04-16 16:07:27

通过代理ip进行分布式爬虫的几种方案

假如不用代理ip,爬虫业务必定无路可行,因此大部分爬虫工作者都会去购买安全稳定的代理ip。使用了高质量的代理ip后,会不会就能够无后顾之忧了呢?这个可不会这么容

来源:互联网

2019-04-16 16:42:41

如何通过拨号VPS搭建自己的代理IP池

如何让爬虫畅通无阻地高效稳定地夜以继日地永不停息地工作,是无数爬虫工作者梦寐以求的愿望。事实再次证明,世上无难事只怕有心人,只要拥有一个独享IP池,就可以让爬虫

来源:互联网

2019-04-16 17:08:04

通过代理服务器实现科学上网的方法安全吗

通过代理服务器实现科学上网的方法安全吗?不得不说,出于各种原因,企业开通VPN上网,开通企业专线的行为并不少见,同时,各种免费收费的代理服务器和VPN服务也比比

来源:挂机精灵

2019-04-19 16:03:58

如何通过代理IP增加某网站文章浏览量

很多时候,刚发布的文章没什么浏览量,为了吸引读者,很多朋友可能会使用代理IP来增加一些初始浏览量。我们知道,有些网站的文章并不是刷新几次就会增加几个浏览量,需要

来源:挂机精灵

2019-04-22 15:56:41

如何通过挂机精灵工具快速增加阅读量

很多运营人员在推广初期,往往想到的办法主要这些:增加阅读量、评论量、点赞量、下载量等等。这些办法想要实现需要两个帮手:一是相对应的软件程序或者代码,二是代理IP

来源:挂机精灵

2019-04-28 14:46:58

如何高效获取大数据?ip代理:用爬虫!

在不同的操作系统中,Python存在细微的差别,因此有几点您需要牢记在心。这里小编使用的是Python3版本。Python自带一个在终端窗口中运行的解释器,让您

来源:互联网

2019-03-22 16:27:55

封号和IP代理,网游工作室最深的两种痛

2018年电子竞技中,IG夺冠人人都说不仅仅是一场游戏的胜利,更是我们对青春的证明。不务正业和那些不被理解的少年时代,现在终于得到了正名,电竞行业和电竞选手也慢

来源:互联网

2019-03-01 15:32:59

挂机精灵代理ip软件解决ip被封

   挂机精灵代理ip软件解决ip被封,现在市面上挂机软件如此之多,该怎么判断这个挂机软件是好用还是不好用呢?我们该如何选择一款适

来源:互联网

2019-02-11 15:16:07

如何通过requests使用代理IP进行爬虫工作

如何通过requests使用代理IP进行爬虫工作?我们知道,一些网站会有相应的反爬虫措施,比如检测某些IP的访问次数或者访问频率,有些反人类的访问速度就会收到限

来源:挂机精灵

2019-07-02 15:37:44