Scrapely:一个纯Python写的HTML抓屏库

Scrapely是一个可以从HTML网页中提取结构数据的库。给定一些网页例子和需要提取的数据,scrapely会对类似网站构造一个通用解析器。注意Scapely和Scrapy是两个功能完全不同的包,仅仅是由同一组开发人员来维护。看了示例你就会清楚Scrapely有什么用。

示例

首先导入scrapely模块

加一些数据来训练你的scraper

训练结束后,这个scraper可以应用在所有类似网站

github主页:https://github.com/scrapy/scrapely

3 收藏

资源整理者简介:rainbow

(新浪微博:@咖啡z熊) 个人主页 · 贡献了111个资源 · 1


直接登录

推荐关注

按分类快速查找

关于资源导航
  • 伯乐在线资源导航收录优秀的工具资源。内容覆盖开发、设计、产品和管理等IT互联网行业相关的领域。目前已经收录 1439 项工具资源。
    推送伯乐头条热点内容微信号:jobbole 分享干货的技术类微信号:iProgrammer