当前位置: 首页 > news >正文

做的最好的美女视频网站云南百度推广开户

做的最好的美女视频网站,云南百度推广开户,广告设计专业可以考什么证,网站后台管理方便吗前言 研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once 背景需求 有个需求:增量读Hudi表关联其他Hudi…

前言

研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once

背景需求

有个需求:增量读Hudi表关联其他Hudi表然后做一些复杂的业务处理逻辑,然后将结果表保存到目标Hudi表中

然后就有问题:如何保证保存目标Hudi表和保存 endCommiTime 是事务的。具体如下
1、Spark支持增量读Hudi表,需要传入起(始) commitTime。
2、上一批数据处理完成后应该保存上次增量读的的 endCommiTime,作为下一批增量读的的 beginCommitTime
3、可以选择将上一批的 endCommiTime 保存到 HDFS 或者数据库表中,但是不能保证事务。(并且还需要借助外部表或者存储目录,如果能通过Hudi本身解决,就比较完美了)
4、也就是可能存在保存目标Hudi表成功,但是保存 endCommiTime 失败的情况

这时就想到了 DeltaStreamer 中是通过设置 checkpoint 来实现的,具体是通过将 commitTime 的值保存到目标表 .commit 元数据文件中(extraMetadata->deltastreamer.checkpoi

http://www.mmbaike.com/news/35321.html

相关文章:

  • 网站策划的最终体现是撰写网站策划书网络营销怎么推广
  • 美妆网站怎么做推广神器app
  • 济南建网站公司排行榜百度浏览器网址大全
  • 做网站平台成本最新国内你新闻
  • 舞钢市做网站开发的公司对seo的认识和理解
  • 吉安做网站的全球新闻最新消息
  • 广州企业如何建网站三叶草gw9356
  • 红色 网站配色个人免费建站系统
  • 网站建设 展滔科技大厦关键词在线查询
  • 旅游网站的后台管理系统怎么做嘉兴seo网络推广
  • 合肥个人做网站网站分析工具
  • 清新大气企业公司网站源码南京seo推广公司
  • 宿迁做网站公司百度客服中心人工在线电话
  • 网站建设进程方案网站如何进行优化
  • 怎么在公众号做影视网站昆明排名优化
  • 男女做爰网站互联网营销策划
  • 最好的营销型网站seo排名怎样
  • 北京做网站的网络公司最吸引人的引流话术
  • 用php做动态网站大作业3小时百度收录新站方法
  • 模板网站和定制网站有什么区别西安关键词排名软件
  • 上海静安做网站多少钱营销型网站建站推广
  • 北京做网站报价seo的形式有哪些
  • 网站开发接入支付宝免费seo教程
  • 最近疫情情况最新通报关键词优化seo优化排名
  • 公司要制作网站今日最火的新闻
  • 广安建网站深圳关键词排名seo
  • 用垃圾网站做外链社群运营
  • 个人网站如何做淘宝客重庆森林经典台词 凤梨罐头
  • 乌鲁木齐网站建设哪家好电商网站链接买卖
  • 做网站的哪家好seo站长博客