二手车交易市场 -尊龙凯时人生就得博

mark wiens

发布时间:2022-11-21

  前段时间给朋友采集某子二手车平台的数据,虽然最后搞定了js加密,也通过价格对比短时间内算是搞定了字体反爬,但总是感觉很不完美,网站字体一共有5种对应关系,每次请求后都用价格对比,严重拖慢了系统运行速度不说,还容易出错……

二手车交易市场

  前段时间给朋友采集某子二手车平台的数据,虽然最后搞定了js加密,也通过价格对比短时间内算是搞定了字体反爬,但总是感觉很不完美,网站字体一共有5种对应关系,每次请求后都用价格对比,严重拖慢了系统运行速度不说,还容易出错。这次换一个平台,采集数据后进行简单的数据分析。

  通过对网页的url分析发现,url地址p后面的数字是用来的控制翻页二手车交易市场,plog_id可以不用添加。继续分析网页源代码:

  发现车辆的信息就在网页源代码里,同时也发现网页有字体反爬,继续在网页源代码里搜索网页字体的url。

  可以看到网页的url地址拼接了车辆的data-car-id,同样后面的plog_id也可以省略。

  通过对请求后的数据分析,由于网页结构差异,有些返回的数据是空二手车交易市场,容易导致写入错误数据,为了方便后期处理,加了判断。同时这里需要注意,chrome浏览器tbody的坑。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系qq:1640731186

网站地图