当前位置:首页 > 免费源码 > 其他源码 >

Tesseract OCR图像识别类库 v5.1.0

时间:2022-03-30 15:16 来源:互联网 作者:沧海一声笑 收藏 推荐

  • 源码类别:其他源码
  • 源码大小:2.37MB
  • 运行环境:其他
  • 下载权限:免费下载
  • 广告推荐

Tesseract OCR图像识别类库包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。


Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。


Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。


安装Tesseract:
您可以通过预建的二进制软件包安装正方体 或从源代码编译它。
支持的编译器是:
GCC 4.8及以上
lang 3.4及以上
MSVC 2015、2017、2019年
其他编译器可能可以工作,但未得到官方支持。
Tesseract OCR图像识别类库
本站资源仅限于学习研究,严禁从事商业或者非法活动! 源码搜藏网所有源码来自互联网转载与用户上传分享,如果侵犯了您的权益请与我们联系,我们将在24小时内删除!谢谢!
下一篇:没有了

其他源码下载排行

最新文章