一个热爱编程的技术博主
这个项目是一个简单的网页爬虫,用于从CSDN博客中抓取相关内容,并将其保存为HTML文件。该项目包括了爬虫的基本流程:爬取、解析和存储。 ### 爬取过程 1. **调度器 (`spider_main.py`)**: - 这是整个项目的入口点。 - 调用 `HtmlOutputer` 来输出数据,调用 `Downloader` 下载网页内容,并调用 `HtmlParser` 解析下