6 资源

文本处理

  • Chardet:通用编码检测器

    beyondwu 整理 1

    Chardet是一个通用编码检测器,支持ASCII、UTF-8、UTF-16等多种编码格式。
    详细介绍 »

  • simplejson:Python的JSON编码/解码器

    rainbow 整理 1

    Simplejson是Python的JSON编码和解码器,它具有简单、快速、完整、正确和易于扩展的特点,支持Python 2.5+和Python 3.3+。为了加速处理速度,它包括一个可选的C扩展。
    详细介绍 »

  • SnowNLP:处理中文文本的Python库

    rainbow 整理 2 4

    SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。
    详细介绍 »

  • Python-docx:读写word文档的Python库

    rainbow 整理 1 2

    Python DocX目前是Python OpenXML的一部分,你可以用它打开Word 2007及以后的文档,而用它保存的文档可以在Microsoft Office 2007/2010, Microsoft Mac Office 2008, Google Docs, OpenOffice.org 3, and Apple iWork 08中打开。
    详细介绍 »

  • Fuzzywuzzy:字符串模糊匹配工具

    rainbow 整理 2 1

    Fuzzywuzzy是一个可以对字符串进行模糊匹配的小工具,使用起来非常简单。
    详细介绍 »

  • TextBlob:简单、Pythonic的文本分析工具

    木头lbj 整理 1

    TextBlob是一个支持Python2和Python3的用于进行文本数据处理的工具包
    详细介绍 »

    按分类快速查找

    关于资源导航
    • 伯乐在线资源导航收录优秀的工具资源。内容覆盖开发、设计、产品和管理等IT互联网行业相关的领域。目前已经收录 1438 项工具资源。
      推送伯乐头条热点内容微信号:jobbole 分享干货的技术类微信号:iProgrammer