Directories
¶
| Path | Synopsis |
|---|---|
|
benchmarks
|
|
|
server
Package server 提供用于性能基准测试的本地 HTTP 服务器。
|
Package server 提供用于性能基准测试的本地 HTTP 服务器。 |
|
cmd
|
|
|
scrapy-go
command
Package main 实现 scrapy-go 命令行脚手架工具。
|
Package main 实现 scrapy-go 命令行脚手架工具。 |
|
contrib
|
|
|
telemetry
module
|
|
|
examples
|
|
|
books_json
command
示例爬虫:从本地 JSON API 读取多页数据,通过 Pipeline 保存到本地 JSON 文件。
|
示例爬虫:从本地 JSON API 读取多页数据,通过 Pipeline 保存到本地 JSON 文件。 |
|
crawlspider
command
示例爬虫:使用 CrawlSpider 演示基于规则的多页面自动爬取。
|
示例爬虫:使用 CrawlSpider 演示基于规则的多页面自动爬取。 |
|
custom_middleware
command
示例爬虫:演示自定义下载器中间件和 Spider 中间件的使用。
|
示例爬虫:演示自定义下载器中间件和 Spider 中间件的使用。 |
|
feedexport
command
示例:演示 scrapy-go 的 Feed Export 数据导出系统完整 API。
|
示例:演示 scrapy-go 的 Feed Export 数据导出系统完整 API。 |
|
itemadapter
command
示例:演示 scrapy-go 的 ItemAdapter 体系完整 API。
|
示例:演示 scrapy-go 的 ItemAdapter 体系完整 API。 |
|
pagination
command
示例爬虫:分页爬取 + 详情页抓取。
|
示例爬虫:分页爬取 + 详情页抓取。 |
|
quotes
command
示例爬虫:使用本地静态网站演示 scrapy-go 框架的完整爬取流程。
|
示例爬虫:使用本地静态网站演示 scrapy-go 框架的完整爬取流程。 |
|
template/project
scrapy-go middlewares 模板
|
scrapy-go middlewares 模板 |
|
template/spiders/basic
command
scrapy-go basic 爬虫模板
|
scrapy-go basic 爬虫模板 |
|
template/spiders/json_api
command
Package main 演示了 scrapy-go 的 Request 便捷 API 用法。
|
Package main 演示了 scrapy-go 的 Request 便捷 API 用法。 |
|
typed_settings
command
示例爬虫:演示 scrapy-go 泛型类型安全 Settings API(TD-004)。
|
示例爬虫:演示 scrapy-go 泛型类型安全 Settings API(TD-004)。 |
|
internal
|
|
|
utils
Package utils 提供 scrapy-go 框架的内部工具函数。
|
Package utils 提供 scrapy-go 框架的内部工具函数。 |
|
pkg
|
|
|
crawler
Package crawler 实现了 scrapy-go 框架的顶层编排器。
|
Package crawler 实现了 scrapy-go 框架的顶层编排器。 |
|
debug
Package debug 提供 scrapy-go 框架的调试和性能分析工具。
|
Package debug 提供 scrapy-go 框架的调试和性能分析工具。 |
|
downloader
Package downloader 实现了 scrapy-go 框架的下载器系统。
|
Package downloader 实现了 scrapy-go 框架的下载器系统。 |
|
downloader/middleware
Package middleware 定义了下载器中间件的接口和内置实现。
|
Package middleware 定义了下载器中间件的接口和内置实现。 |
|
downloader/middleware/httpcache
Package httpcache 实现了 HTTP 缓存中间件,对应 Scrapy 的 HttpCacheMiddleware。
|
Package httpcache 实现了 HTTP 缓存中间件,对应 Scrapy 的 HttpCacheMiddleware。 |
|
engine
Package engine 实现了 scrapy-go 框架的核心调度引擎。
|
Package engine 实现了 scrapy-go 框架的核心调度引擎。 |
|
errors
Package errors 定义了 scrapy-go 框架中跨包共享的错误类型。
|
Package errors 定义了 scrapy-go 框架中跨包共享的错误类型。 |
|
extension
Package extension 实现了 scrapy-go 框架的扩展(Extension)系统。
|
Package extension 实现了 scrapy-go 框架的扩展(Extension)系统。 |
|
feedexport
Package feedexport 实现了 scrapy-go 框架的数据导出(Feed Export)系统。
|
Package feedexport 实现了 scrapy-go 框架的数据导出(Feed Export)系统。 |
|
http
Package http 定义了 scrapy-go 框架的 HTTP 请求和响应模型。
|
Package http 定义了 scrapy-go 框架的 HTTP 请求和响应模型。 |
|
item
Package item 提供 scrapy-go 框架的 Item 统一访问抽象(ItemAdapter 体系)。
|
Package item 提供 scrapy-go 框架的 Item 统一访问抽象(ItemAdapter 体系)。 |
|
linkextractor
Package linkextractor 提供链接提取器接口和实现。
|
Package linkextractor 提供链接提取器接口和实现。 |
|
log
Package log 提供了 scrapy-go 框架的结构化日志封装。
|
Package log 提供了 scrapy-go 框架的结构化日志封装。 |
|
pipeline
Package pipeline 定义了 scrapy-go 框架的 Item Pipeline 接口和管理器。
|
Package pipeline 定义了 scrapy-go 框架的 Item Pipeline 接口和管理器。 |
|
pool
Package pool 提供 HTTP 请求/响应对象池,用于减少 GC 压力。
|
Package pool 提供 HTTP 请求/响应对象池,用于减少 GC 压力。 |
|
scheduler
Package scheduler 实现了 scrapy-go 框架的请求调度系统。
|
Package scheduler 实现了 scrapy-go 框架的请求调度系统。 |
|
scraper
Package scraper 实现了 scrapy-go 框架的 Scraper 组件。
|
Package scraper 实现了 scrapy-go 框架的 Scraper 组件。 |
|
selector
Package selector 提供 HTML/XML 文档的 CSS 和 XPath 选择器。
|
Package selector 提供 HTML/XML 文档的 CSS 和 XPath 选择器。 |
|
settings
Package settings 实现了 scrapy-go 框架的多优先级配置系统。
|
Package settings 实现了 scrapy-go 框架的多优先级配置系统。 |
|
signal
Package signal 实现了 scrapy-go 框架的信号/事件系统。
|
Package signal 实现了 scrapy-go 框架的信号/事件系统。 |
|
spider
Package spider 定义了 scrapy-go 框架的 Spider 接口和基础实现。
|
Package spider 定义了 scrapy-go 框架的 Spider 接口和基础实现。 |
|
spider/middleware
Package middleware 定义了 Spider 中间件的接口和管理器。
|
Package middleware 定义了 Spider 中间件的接口和管理器。 |
|
stats
Package stats 实现了 scrapy-go 框架的统计收集系统。
|
Package stats 实现了 scrapy-go 框架的统计收集系统。 |
|
telemetry
Package telemetry 定义了 scrapy-go 框架的可观测性扩展点接口。
|
Package telemetry 定义了 scrapy-go 框架的可观测性扩展点接口。 |
Click to show internal directories.
Click to hide internal directories.