我正在开始尝试爬取亚马逊某一个网页的内容,这样能解放我的日常监控工作
但是我遇到的第一个问题是python在调用requests.get这个函数打开特定的亚马逊网页时返回了503错误
于是我通过学习了解到了headers这个假装自己的程序是人类的东西,根据各种教程的指导,我陆续在headers这个字典中加入了User-Agent,Accept-Language ,sec-ch-ua,accept,cache-control,在第一次加入user—agent这个参数之后,我很高兴看到页面不在返回503,但是当我保存并打开爬取的页面发现那是一个机器验证页面,也因此我不断加入了各种参数来假装自己的人类,但是至今我也没有成功的通过python打开过哪怕一次亚马逊的网站页面
现在我不知道还哪些方式能够让我的程序看起来更像是人类,好能够让我通过python成功打开一次亚马逊的页面
我向你们求助,来帮助我完成这个地狱级别难度的第一步,尽管我只是个新手,如果你真的帮助我解答了这个问题,我将会非常感谢
>>: [Vue2] 从初学到放弃 Day5-生命周期Hooks
[Day8] Fun with HTML5 Canvas Canvas 的运用 需要用到的技巧与练习...
今天我们要让之前的程序能跟 Chat Bot 连动。 需要 Worker 吗? 直接从程序中 POS...
宣告方式 var array_name = [length]datatype{values} var...
当我们新增成功之後, 就会回到列表页, 这时候我们要补做两个动作, 一个是把之前没有处理完的列表处理...
视图(检视)模型 / ViewModel 主要用於为View提供资料 ViewModel当中的属性不...