scrapy项目启动

Scrapy是一个用于爬取网站数据的Python框架，它基于Twisted异步网络库。以下是使用Scrapy创建爬虫的基本步骤：

安装Scrapy：在命令行中运行以下命令安装Scrapy。
```
 pip install scrapy
```
创建新的Scrapy项目：在命令行中运行以下命令，创建一个新的Scrapy项目。
```
 scrapy startproject your_project_name
```
这将创建一个名为your_project_name的目录，其中包含一个Scrapy项目的基本结构。
创建爬虫：进入项目目录并创建一个新的爬虫。
```
 cd your_project_name
 scrapy genspider your_spider_name example.com
```
这将在spiders目录下创建一个名为your_spider_name的爬虫，它将从example.com网站开始爬取数据。

编辑爬虫代码：打开生成的爬虫文件（在your_project_name/spiders/目录下），编辑start_urls和parse方法，定义如何提取数据。

 import scrapy

 class YourSpiderNameSpider(scrapy.Spider):
     name = 'your_spider_name'
     allowed_domains = ['example.com']
     start_urls = ['http://www.example.com']
     def parse(self, response):
         # 提取数据的逻辑
         pass

运行爬虫：在项目目录中运行以下命令，启动爬虫。
```
 scrapy crawl your_spider_name
```
爬虫将开始执行，并在控制台上显示爬取的数据。