欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

Python爬虫之破解百度翻译--requests案例详解(一)

2022-10-09 17:32:36 433

摘要:上节课我们通过requests模块讲了简单的网页采集方法,这一节课我们讲一下怎么用requests模块破解百度翻译。其中包含的知识点有post请求、Jason、异步加载等内容。这节课由于信息量比较大,所以分两节课介绍:一、主要提取的内容我们...

上节课我们通过requests模块讲了简单的网页采集方法,这一节课我们讲一下怎么用requests模块破解百度翻译。其中包含的知识点有post请求、Jason、异步加载等内容。这节课由于信息量比较大,所以分两节课介绍:


一、主要提取的内容


我们通过输入一次词,将翻译的结果部分(如下图)提取出来



二、爬取步骤解析


第一步,首先导入requests模块



第二步,分析页面


1.我们在输入词语的时候,我们会发现翻译结果随之就加载出来了,不像我们上节课在浏览器搜索的时候,需要回车才能够出来,因此我们就引出了一个概念--ajax异步加载


2.ajax异步加载是什么?



3.查看方式发生变化


因为ajax异步加载,我们不能再像以前一样查看数据了(如下图),我们不再是查看network下面的全部数据,我们选择network-xhr下的数据,我们通过查看xhr预览选项发现,v2tranapi文件下的数据是我们想要的,因此我们xhr-v2tranapi--表头进入,查找我们想要的数据。



注意:之前用的是谷歌浏览器查看数据,这次用的苹果自带浏览器查看,如果用不习惯可以和谷歌位置对照使用!


分析完了数据,下节课我们就来正式书写代码


版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网