python爬虫代码案例(python爬虫爬取图片代码)-亲测免费分享网

python爬虫代码案例(python爬虫爬取图片代码)

亲测学习网 • 2023年4月18日下午4:31 • python教程 • 阅读 103

Python爬虫简介

Python爬虫是指使用Python程序从互联网上获取数据的过程。使用Python语言进行爬虫可以快速、简单地获取大量的数据，同时具有广泛的适用范围，被广泛应用于互联网数据分析、大数据处理、机器学习等领域。在Python中，常用的爬虫模块有urllib、requests、BeautifulSoup等。

Python爬虫代码案例

以下是一个Python爬虫代码的案例，用于爬取豆瓣电影排行榜中的电影名称和评分，并将其保存在一个txt文件中：

import requests
from bs4 import BeautifulSoup

url = 'https://movie.douban.com/chart'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
movies = soup.select('.pl2>a')
rates = soup.select('.rating_nums')
with open('movies.txt', 'w') as f:
    for movie, rate in zip(movies, rates):
        f.write(movie['title'] + 't' + rate.text + 'n')

代码中首先使用requests模块获取豆瓣电影排行榜页面的HTML源码，然后使用BeautifulSoup模块解析出电影名称和评分，最后将其写入到一个txt文件中。通过这个简单的代码案例，可以看到Python爬虫的简单、高效、灵活的特点。

python爬虫代码案例(python爬虫爬取图片代码)