Newspaper:使用Python开发的新闻和文章提取程序

Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。

作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。

支持10多种语言并且所有的都是unicode编码。

以下是简单的使用示例:

如果没有指定语言,Newspaper会尝试自动识别。

如果你能确定文章使用的是同一种语言,可以使用同样的API。

文档:http://newspaper.readthedocs.org/en/latest/
GitHub主页:https://github.com/codelucas/newspaper

2 4 收藏

资源整理者简介:木头lbj

Everyday is a lame!Life is short,I use Python! 个人主页 · 贡献了36个资源 · 1 ·      


直接登录

推荐关注

按分类快速查找

关于资源导航
  • 伯乐在线资源导航收录优秀的工具资源。内容覆盖开发、设计、产品和管理等IT互联网行业相关的领域。目前已经收录 1439 项工具资源。
    推送伯乐头条热点内容微信号:jobbole 分享干货的技术类微信号:iProgrammer