▎项目介绍:一个多模态 OCR 系统,专门用于从复杂的教育材料,如考试试卷中提取结构化数据,以优化机器学习训练。
支持多种语言,包括日语、韩语和英语,能够处理数学公式、表格、图表等元素,并生成适合 AI 的 JSON 或 Markdown 格式输出。
▎项目地址:点击打开
▎项目功能:文档解析和提取
▎项目介绍:一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。
▎项目地址:点击打开
🔎 Surya - 开源多功能文档 OCR 工具包
▎项目功能:OCR 文本识别
▎项目介绍:一个开源 OCR 工具,能够处理超过90种语言的文本识别,支持图像和 PDF 格式文档的文字提取、布局分析以及行检测。
支持批量处理,并针对 GPU 优化,能够提高处理效率,还提供了交互式界面让用户更方便地测试功能。
Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。
▎项目地址:点击打开
▎项目功能:OCR 文字识别
▎项目介绍:一款基于 PaddleOCR 重构,并且脱离 PaddlePaddle 深度学习训练框架的轻量级 OCR 模型,推理速度超快。
在算力有限,精度不变情况下使用 paddleOCR 转成 ONNX 模型,进行重新构建的一款可部署在 arm 架构和 x86 架构计算机上的 OCR 模型,在同样性能的计算机上推理速度加速了 4-5 倍。
▎项目地址:点击打开
▎软件功能:图像内容识别
▎软件平台:#Web #Windows #macOS #Linux
▎软件介绍:一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。
它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
▎在线体验:点击打开
▎网站版本:点击打开
▎相关推荐:
▎软件下载:点击下载
🔎 WeOCR - 一个极简无需安装的 OCR 工具
▎网站功能: 图片文字提取
▎网站介绍: 一个极简的 OCR 工具,无需安装,支持离线图片文字提取。
只需上传或直接粘贴,即可识别图片文字,无需网络,本地处理,目前支持Tesseract,支持多语言。
▎网站网址: 点击打开
✈️ 频道导航 —— 资源目录
频道主要分享免费资源,实用软件、开源项目、网站工具。
🗒 Telegram 中文语言包
💡 Telegram 新手教程
📁 标签分类
#网站 #软件 #插件 #脚本
#开源 #工具 #辅助 #导航
#教程 #科普 #编程 #翻墙
#音频 #图像 #镜像 #笔记
#网盘 #邮箱 #解析 #传输
#磁力 #接口 #规则 #备份
#外语 #翻译 #限免 #系统
#爬虫
#音乐 #影视 #动漫 #漫画
#小说 #游戏 #杂志 #期刊
#趣站 #书源 #字体 #素材
#设计 #艺术 #壁纸 #古籍
#字幕 #博客 #新闻
#合集
#电子书 #第三方 #浏览器 #播放器
#纪录片 #输入法 #虚拟机 #直播源
#白噪音 #博物馆 #搜索引擎
#AI #BT
#BOT #API #IPA #RSS
#OCR #TTS #PDF
#IPTV
#GitHub #TVBox #ChatGPT
#Web #Android #iOS
#Windows #macOS #Linux
#TV #tvOS
#Chrome #Firefox #Edge #Safari
#Tampermonkey
#Telegram
👤 联系方式