当前位置: 首页 > news >正文

网站里的图片是怎么做的图片外链在线生成网址

网站里的图片是怎么做的,图片外链在线生成网址,seo可以从哪些方面优化,微信平台专业网站建设文章目录 六、PyMuPDF的OCR识别6.1 使用 Tesseract进行OCR6.2 使用MuPDF进行OCR6.3 使用 Python 包easyocr进行OCR识别6.4 使用 Python ocrmypdf包进行OCR识别6.5 将图像批量OCR并转换为PDF七、PDF附加、嵌入、批注等7.1 附加文件7.2 嵌入文件7.3 从文档中获取所有批注六、PyMu…

文章目录

  • 六、PyMuPDF的OCR识别
    • 6.1 使用 Tesseract进行OCR
    • 6.2 使用MuPDF进行OCR
    • 6.3 使用 Python 包easyocr进行OCR识别
    • 6.4 使用 Python ocrmypdf包进行OCR识别
    • 6.5 将图像批量OCR并转换为PDF
  • 七、PDF附加、嵌入、批注等
    • 7.1 附加文件
    • 7.2 嵌入文件
    • 7.3 从文档中获取所有批注

六、PyMuPDF的OCR识别

https://github.com/pymupdf/PyMuPDF-Utilities/tree/master/OCR
在这里插入图片描述

使用 PyMuPDF 和 OCR 的演示脚本
从 1.18.0 版本开始,MuPDF 支持动态调用 Tesseract OCR 来解释页面或图像上的文本。从其版本 1.19.0 开始,PyMuPDF 已开始支持此接口。

6.1 使用 Tesseract进行OCR

此演示脚本读取包含无法解释的字符的文档文本。这些字符被编码为 MuPDF。在每次遇到与此字符的文本跨度时,都会通过 Python 调用 Tesseract OCR 进行解释。脚本和 Tesseract 安装之间没有其他/直接连接。chr(65533)subprocess

脚本的方法是这样的

  • 将页面的文本解压缩到 via .dictget_text(“dict”, flags=0)[“blocks”]
  • 遍历字典并检查 span 文本是否包含 .chr(65533)
  • 在这种情况下,请创建跨度的 bbox 的像素图,并调用 Tesseract 来对此图像进行 OCR。
  • 打印新旧文本以进行视觉比较。

每个此类 OCR 操作的平均持续时间约为 0.65 秒(Windows 10,64 位,

http://www.mmbaike.com/news/36401.html

相关文章:

  • 电子商务网站的网络营销策略分析网站设计公司多少钱
  • 帮企商城源码谷歌关键词排名优化
  • 洛阳建设企业网站公司seo关键词优化最多可以添加几个词
  • 做网站还有希望吗快速提升排名seo
  • 建立免费公司网站爱站网关键词查询工具
  • 网站备案问题模板建站平台
  • 网站建设实训教程做app的网站
  • 太平桥网站建设群站优化之链轮模式
  • 何如做外贸网站推网近期热点新闻
  • 代码中可以做自己的网站吗济南百度公司
  • 注册网站查询微商怎么引流被别人加
  • 通过音乐做网站外链优就业seo怎么样
  • wordpress入口北京优化推广
  • 如何做局域网网站新手怎么入行seo
  • b站大全不收费百度用户服务中心官网
  • 免费网站正能量入口下载谷歌网站优化推广
  • wordpress图片外链网站优化课程培训
  • 二次元下午茶wordpressseo搜狗排名点击
  • 网络工程技术课设报告如何进行搜索引擎优化
  • 临平做网站电话网络营销工具与方法
  • 如何做网站连接石家庄新闻
  • 传奇服务器网站如何建设百度非企渠道开户
  • 宠物店网站模板小程序搭建教程
  • 外贸在哪个网站做免费网站推广软文发布
  • 网站模板素材网上营销型网站
  • 做 网站 技术支持 抓获 互助宁波品牌网站推广优化公司
  • 金坛城乡建设管理网站济宁seo优化公司
  • 做进料加工在哪个网站上做百度信息流投放
  • 平阳网站建设网站之家
  • 专业的网站建设科技公司seo长尾关键词优化