当前位置: 首页 > news >正文

小地方的旅游网站怎么做网页设计图

小地方的旅游网站怎么做,网页设计图,经典企业网站欣赏,做我的世界头像的网站🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵 幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个…

🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵

幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个转换过程。而且支持常见的多种文件格式!🐶

比如说,如果我们要从一个PPT文件里提取数据,可以用partition_pptx函数:

from unstructured.partition.pptx import partition_pptxfilename = "example_files/msft_openai.pptx"
elements = partition_pptx(filename=filename)

这个函数会把PPT文件的内容解析成一个elements列表,每个元素都是一个Element对象,分别代表PPT里的标题、文字、图片等内容。

但是我们想要的是结构化数据而不是对象呀,所以还需要再转换一下:

element_dict = [el.to_dict() for el in elements]
print(json.dumps(element_dict, indent=2))

这两行代码的作用是:

  1. 遍历elements列表,把每个Element对象都转换成字典(调用它们的to_dict方法)
  2. 把这些字典组成一个新列表element_dict
  3. 使用json.dumpselement_dict转成Json格式的字符串,并指定indent=2让结果更加美观

是不是很酷?现在我们就拥有了结构化的数据啦!

如果是PDF文件的话,流程也差不多:

from unstructured.shared import Files, PartitionParameters
from unstructured.openai_api import SDKfilename = "example_files/CoT.pdf"
with open(filename, "rb") as f:files = Files(content=f.read(), file_name=filename)req = PartitionParameters(files=files, strategy='hi_res', pdf_infer_table_structure=True)s = SDK.get_instance() 
resp = s.general.partition(req)
print(json.dumps(resp.elements, indent=2))

这里主要新的地方是用Files对象来存PDF文件的内容,然后定义一个PartitionParameters来设置处理策略(比如识别表格等)。

最后就是创建SDK实例,调用partition方法,传入之前定义的参数,就能获取PDF里的结构化数据啦!

对于Excel文件,官方文档里也有介绍,应该也是类似的操作。

有了这些技能,我们就能把海量的非结构化数据高效地转换成结构化格式,喂给大模型"吃"啦!以后制作AI应用的时候,效率和开发体验都会更上一层楼~🚀

http://www.mmbaike.com/news/78195.html

相关文章:

  • 做网站需要走公司吗营销对企业的重要性
  • 网站建设文档中国十大公关公司排名
  • 个人电脑可以做网站服务器吗如何在网上推广自己的公司
  • 在网络上做兼职的网站推广游戏赚钱的平台有哪些
  • 北京住房建设厅网站企业网络营销的模式有哪些
  • 阿里云建立wordpress做seo要投入什么
  • 公司企业logo设计博客网站seo
  • 如何在国外做网站免费网络推广软件
  • 商城网站平台怎么做搜索引擎的工作原理有哪些
  • 东莞做网站有哪些产品网络推广的方法
  • 专做蓝领招聘网站有哪些松原头条新闻今日新闻最新
  • 网站设计制作全网优惠seo的基本工作内容
  • 网站没备案可以访问吗百度代理公司怎么样
  • 苏州市吴江区住房和城乡建设局网站seo还有用吗
  • 兰州网站建设100专门的网页制作工具有
  • 做网站每年需付费吗推广普通话手抄报文字
  • 网站建设越来越难做seo搜索引擎优化价格
  • 网站建设+太原做一个简单网页
  • 专业团队pptseo优化及推广如何运营
  • 商城网站开发视频教程windows优化软件哪个好
  • 山西做网站公司软文营销的作用有哪些
  • 公司开发个网站有哪些dw网页设计模板网站
  • 北京西站电话什么软件可以排名次
  • 高端网站制作怎么样网站优化价格
  • 上海徐家汇网站建设天津优化公司
  • 高邮市建设网站网站改版
  • 个人做网站靠什么挣钱获取排名
  • 南京做网站南京乐识专业昆明seo排名
  • 网站建设具体方案深圳市seo上词多少钱
  • python做的网站网络服务提供者收集和使用个人信息应当符合的条件有