Pytesseract:对Google Tesseract的一层python封装

pytesseract

简介

Python-tesseract是一款用于光学字符识别(OCR)的python工具,即从图片中识别出其中嵌入的文字。Python-tesseract是对Google Tesseract-OCR的一层封装。它也同时可以单独作为对tesseract引擎的调用脚本,支持使用PIL库(Python Imaging Library)读取的各种图片文件类型,包括jpeg、png、gif、bmp、tiff和其他格式。作为脚本使用它将打印出识别出的文字而非写入到文件。

安装

依赖

  • Python-tesseract要求python2.5及以上或者python3
  • 需要安装PIL库(Python Imaging Library)
  • 需要安装google tesseract-ocr包

示例

协议

Python-tesseract遵循GPL v3开源协议发布。

开源地址:https://github.com/madmaze/pytesseract

1 1 收藏

资源整理者简介:beyondwu

简介还没来得及写 :) 个人主页 · 贡献了14个资源 · 1


直接登录
最新评论

推荐关注

按分类快速查找

关于资源导航
  • 伯乐在线资源导航收录优秀的工具资源。内容覆盖开发、设计、产品和管理等IT互联网行业相关的领域。目前已经收录 1440 项工具资源。
    推送伯乐头条热点内容微信号:jobbole 分享干货的技术类微信号:iProgrammer