▎项目介绍:一个多模态 OCR 系统,专门用于从复杂的教育材料,如考试试卷中提取结构化数据,以优化机器学习训练。
支持多种语言,包括日语、韩语和英语,能够处理数学公式、表格、图表等元素,并生成适合 AI 的 JSON 或 Markdown 格式输出。
▎项目地址:点击打开
▎项目功能:文档解析和提取
▎项目介绍:一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。
▎项目地址:点击打开
🔎 Surya - 开源多功能文档 OCR 工具包
▎项目功能:OCR 文本识别
▎项目介绍:一个开源 OCR 工具,能够处理超过90种语言的文本识别,支持图像和 PDF 格式文档的文字提取、布局分析以及行检测。
支持批量处理,并针对 GPU 优化,能够提高处理效率,还提供了交互式界面让用户更方便地测试功能。
Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。
▎项目地址:点击打开
▎项目功能:OCR 文字识别
▎项目介绍:一款基于 PaddleOCR 重构,并且脱离 PaddlePaddle 深度学习训练框架的轻量级 OCR 模型,推理速度超快。
在算力有限,精度不变情况下使用 paddleOCR 转成 ONNX 模型,进行重新构建的一款可部署在 arm 架构和 x86 架构计算机上的 OCR 模型,在同样性能的计算机上推理速度加速了 4-5 倍。
▎项目地址:点击打开
▎软件功能:图像内容识别
▎软件平台:#Web #Windows #macOS #Linux
▎软件介绍:一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。
它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
▎在线体验:点击打开
▎网站版本:点击打开
▎相关推荐:
▎软件下载:点击下载