摘要:上节课我们通过requests模块讲了简单的网页采集方法,这一节课我们讲一下怎么用requests模块破解百度翻译。其中包含的知识点有post请求、Jason、异步加载等内容。这节课由于信息量比较大,所以分两节课介绍:一、主要提取的内容我们...
上节课我们通过requests模块讲了简单的网页采集方法,这一节课我们讲一下怎么用requests模块破解百度翻译。其中包含的知识点有post请求、Jason、异步加载等内容。这节课由于信息量比较大,所以分两节课介绍:
我们通过输入一次词,将翻译的结果部分(如下图)提取出来
1.我们在输入词语的时候,我们会发现翻译结果随之就加载出来了,不像我们上节课在浏览器搜索的时候,需要回车才能够出来,因此我们就引出了一个概念--ajax异步加载
2.ajax异步加载是什么?
3.查看方式发生变化
因为ajax异步加载,我们不能再像以前一样查看数据了(如下图),我们不再是查看network下面的全部数据,我们选择network-xhr下的数据,我们通过查看xhr预览选项发现,v2tranapi文件下的数据是我们想要的,因此我们xhr-v2tranapi--表头进入,查找我们想要的数据。
注意:之前用的是谷歌浏览器查看数据,这次用的苹果自带浏览器查看,如果用不习惯可以和谷歌位置对照使用!
分析完了数据,下节课我们就来正式书写代码