requests加了代理后返回403:解决Python请求代理403错误

为什么加了代理IP还会报403？先搞懂这个逻辑

很多新手在用requests加代理时，看到403就懵了——明明都挂代理了咋还被拒绝？这事儿得从服务器怎么识别爬虫说起。服务器看到异常请求时，会查三个关键点：请求频率、请求特征、IP健康度。就算你用了代理，要是IP被标记为危险、请求头太假，或者同一IP访问太频繁，照样吃闭门羹。

实战四步走：手把手解决403难题

第一步：先确认代理IP是不是活的 很多人拿网上随便找的免费代理就往代码里塞，结果连基本连通性都没验证。用全民代理IP的话，记得他们家的接口会返回status: active的可用IP，拿到IP后先用这个套路测试：

```python import requests proxies = {"http": "http://用户名:密码@ip:端口", "https": "http://用户名:密码@ip:port"} try: test = requests.get("http://httpbin.org/ip", proxies=proxies, timeout=5) print("代理可用:", test.json()) except Exception as e: print("代理挂了:", e) ```

第二步：请求头别偷懒 全民代理IP虽然提供高匿代理，但你自己代码里的请求头也得像个人。举个反面教材：

错误姿势	正确姿势
headers = {'User-Agent': 'python-requests'}	headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0) ...'}

建议用fake_useragent库随机生成，别总用同一个浏览器标识。

避开三个巨坑：老司机翻车实录

坑一：代理类型没选对 全民代理IP有动态住宅、静态长效、机房IP三种类型。要是爬电商网站用机房IP，分分钟被识别。根据场景这样选： • 需要高匿选动态住宅 • 长期任务用静态长效 • 秒杀用机房IP 坑二：超时设置太随意 很多人不设timeout参数，结果卡死整个程序。建议根据业务需求设置： connect_timeout = 3 连接代理的时间 read_timeout = 10 等待响应的时间 坑三：死磕一个IP 看到403还不停重试，只会让IP更快被封。全民代理IP的自动更换功能要这样用：

```python from retrying import retry @retry(stop_max_attempt_number=3) def request_with_retry(url): 这里调用全民代理IP的API获取新IP new_proxy = get_new_proxy() return requests.get(url, proxies=new_proxy) ```