博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python 爬取拉钩网工作岗位
阅读量:5364 次
发布时间:2019-06-15

本文共 1254 字,大约阅读时间需要 4 分钟。

如果拉钩网html页面做了调整,需要重新调整代码

代码如下

#/usr/bin/env python3#coding:utf-8import sysimport jsonimport requests"""Usage:        python3 lagou.py  
"""def get_jobs(pn=1,kw="python"): url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false' payload = {
"first":"false","pn":pn,"kd":kw} #payload = {'needAddtionalResult':'false'} rr = requests.post(url,data=payload) #print(r.json()) jobs_data = rr.json() #print(jobs_data["content"]["positionResult"]["result"][0]) jobs = jobs_data["content"]["positionResult"]["result"] for i in jobs: print("学历:" + i["education"]) print("城市:" + i["city"]) # print("福利:" + i["companyLabelList"]) print("薪资:" + i["salary"]) print("职位:" + i["positionName"]) print("要求:" + i["positionAdvantage"]) print("经验:" + i["workYear"]) print("链接:" + "https://www.lagou.com/jobs/" + str(i["positionId"]) + ".html") print()if __name__ == '__main__': #pn表示页数,kw表示关键词搜索 pn = sys.argv[1] kw = sys.argv[2] get_jobs(pn,kw)

 

转载于:https://www.cnblogs.com/linyouyi/p/11409869.html

你可能感兴趣的文章
ZOJ 1133
查看>>
HIVE和HADOOP的一些东西
查看>>
alibaba / zeus 安装 图解
查看>>
Planned Delivery Time as Work Days (SCN discussion)
查看>>
Ubuntu:让桌面显示回收站
查看>>
Android上传头像代码,相机,相册,裁剪
查看>>
git 安装体验
查看>>
Oracle 给已创建的表增加自增长列
查看>>
《DSP using MATLAB》Problem 2.17
查看>>
if 循环
查看>>
uva 111 History Grading(lcs)
查看>>
Python学习week2-python介绍与pyenv安装
查看>>
php判断网页是否gzip压缩
查看>>
一个有意思的js实例,你会吗??[原创]
查看>>
sql server中bit字段实现取反操作
查看>>
Part3_lesson2---ARM指令分类学习
查看>>
jQuery拖拽原理实例
查看>>
JavaScript 技巧与高级特性
查看>>
Uva 11729 Commando War
查看>>
增强学习(一) ----- 基本概念
查看>>