python爬取全国城市历史天气数据
- 爬取全国城市2011至2020每天天气数据
- 以requests+BeautifulSoup的方式抓取数据
- 多线程爬取
- 按城市名爬取后按省份存为xls
- 从全国城市名称对应拼音构造字典时,存在城市拼音相同问题
- 这个网站对城市的拼音有错误导致数据爬不到
- 构造省份城市字典,按照省份创建文件夹归档
- 数据来源:天气后报网站
- 完整代码及数据:项目地址
分析资源URL
http://www.tianqihoubao.com/lishi/beijing/month/201101.html
易见http://www.tianqihoubao.com/lishi/{城市拼音}/month/{年月}.html
主要代码
1 | class Crawler(threading.Thread,): |