当前位置: 首页 > news >正文

吉林做网站公司青山seo排名公司

吉林做网站公司,青山seo排名公司,wordpress mu调取,免费做团购网站的软件目录 预览效果安装下载模型测试代码总结 欢迎关注 『python爬虫』 专栏,持续更新中 欢迎关注 『python爬虫』 专栏,持续更新中 预览效果 支持转化pdf的表格 安装 Docling 本身是专注于文档转换的工具,通常用于将文件(如 PDF&…

目录

    • 预览效果
    • 安装
    • 下载模型
    • 测试代码
    • 总结


欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中

预览效果

支持转化pdf的表格

在这里插入图片描述

安装

Docling 本身是专注于文档转换的工具,通常用于将文件(如 PDF)转换为其他格式(如 Markdown)

要求python3.11版本+

pip install docling

下载模型

  • 第一次运行需要下载外网的模型,需要tz保证网络通畅,否则会一直飘红报错
  • 可能需要较长时间计算分析,尤其是你没有GPU 使用CPU的情况
Fetching 9 files: 100%|██████████| 9/9 [00:00<00:00, 15840.85it/s]
Neither CUDA nor MPS are available - defaulting to CPU. Note: This module is much faster with a GPU.

测试代码

from docling.document_converter import DocumentConverter# 第一次运行需要下载外网的模型,需要tz保证网络通畅# 外网pdf论文
# source = "https://arxiv.org/pdf/2206.01062"  # document per local path or URL# 可以是网页
# source = "https://blog.csdn.net/u011027547/article/details/143885170"  # document per local path or URL# 可以是pdf
source = "https://www.gov.cn/zhengce/zhengceku/2022-11/12/5726417/files/b0d97070c0674ab0a1dec4ccd45dd726.pdf"  # document per local path or URL# 初始化 DocumentConverter
converter = DocumentConverter()# 执行转换
result = converter.convert(source)# 获取转换后的 Markdown 内容
markdown_content = result.document.export_to_markdown()# 保存到 .md 文件
with open(source.split('/')[-1]+".md", "w", encoding="utf-8") as md_file:md_file.write(markdown_content)print("Markdown 文件已保存为 "+source.split('/')[-1]+".md")

总结

大家喜欢的话,给个👍,点个关注!给大家分享更多计算机专业学生的求学之路!

版权声明:

发现你走远了@mzh原创作品,转载必须标注原文链接

Copyright 2023 mzh

Crated:2023-3-1

欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中
『未完待续』


http://www.mmbaike.com/news/32811.html

相关文章:

  • 上海静安做网站多少钱做关键词优化的公司
  • 网上商城网站建设方案书郑州seo建站
  • 马家堡网站建设最佳搜索引擎
  • 德州制作网站哪家最专业百度网站大全
  • 手机网站知识seo咨询岳阳
  • 汕头市做网站优化深圳关键词推广排名
  • wordpress评论加头像廊坊seo排名公司
  • 大连软件公司排行aso优化报价
  • 网站分享按钮新能源汽车公司
  • wordpress主体功能开发杭州网站推广与优化
  • axure rp怎么做网站百度文库首页官网
  • 网站建设关键字百度大数据分析
  • 您的网站未备案seo网站管理招聘
  • 烟台做外贸网站seo关键词排名优化怎样
  • 有没有可以做网站动图的软件百度关键词优化点击 教程
  • 平面设计作品图片大全宁波网站快速优化
  • 为什么百度不收录我的网站网站seo优化课程
  • 河南做网站 河南网站建设深圳有实力的seo公司
  • wordpress旅行地图主题seo全网营销公司
  • 路由器做php网站新泰网站设计
  • 怎么用网页制作一个网站百度关键词模拟点击软件
  • 眉山网站建设公司长春网站公司哪家好
  • 怎么把自己做的网站放到公网上整合营销传播策划方案
  • 北京的网站建设公司有哪些seo三人行论坛
  • 西安汽车网站制作百度浏览器手机版
  • 靠谱网站建设公司有哪些广告seo是什么意思
  • 企业建设网站公司简介站长工具seo综合查询5g
  • 网站推广服务网址人教版优化设计电子书
  • 做网站如何与美工配合网页设计与制作个人网站模板
  • java 网站开发 好书网站维护是什么意思