当前位置: 首页 > news >正文

2345网址电脑版首页北京网络推广优化公司

2345网址电脑版首页,北京网络推广优化公司,上海工程信息网,wordpress修改首页网址📑 DataX和dataX-web 集群部署及使用 一 . 安装前准备 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 DataX 采用 框架 插件 的模式…

📑 DataX和dataX-web 集群部署及使用

一 . 安装前准备

DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

DataX 采用 框架 + 插件 的模式:

  • 插件只需关心数据的读取或者写入本身
  • 同步时的共性问题,如 类型转换,性能,统计 由框架来处理

开发插件时 只需要关注两个问题:

  • 数据源本身读写的数据正确性
  • 如何与框架沟通,合理正确地使用框架

逻辑执行模型:

  • Job:是DataX描述一个源头到一个目的端的同步作业,是DataX数据同步的最小业务单元。如将一张mysql表同步到odps一个表的分区
  • Task:是Job拆分得到的最小执行单元。如在同步一张1024哥分表的mysql分库分表的Job时,就可拆分成1024个读Task并发执行
  • TaskGroup:一组Task集合,在同一个TaskGroupContainer执行下的Task集合
  • JobContainer:Job执行器,负责job全局拆分,调度,前置语句和后置语句等工作的工作单元。类似Yarn中的JobTracker 调度Job的每一个子任务task运行于TaskTracker上
  • TaskGroupContainer:TaskGroup的执行器,负责一组Task的工作单元。类似Yarn中的TaskTrackerTaskTracker主动与JobTracker通信,接收作业,并负责直接执行每一个任务。

框架为插件提供物理上的执行能力(线程)。框架有三种运行模式

  • Standalone:单线程运行,没有外部依赖
  • Local:单线程运行,统计信息,错误信息汇报到集中存储
  • Distributed:分布式多线程运行,依赖 DataX Service 服务

当 JobContainer和TaskGroupContainer 运行在同一个进程内时,就是单机模式(Standalone和local);当他们分布在不同的进程中执行就是分布式(distributed)

datax-web 集群部署时单独起某一个功能 ./bin/start.sh -m datax-executor

datax二次开发

datax源码学习

datax二次开发打包

dataX、dataX-web安装部署 dataX集群模式

二 . 配置datax和datax-web

1 安装dataX

使用源码自定义打包

链接 datax 源码

 mvn -U clean package assembly:assembly -Dmaven.test.skip=true

路径在 /target/datax/datax/ 下面

(需要python环境及maven环境)

#测试命令
python bin/datax.py job/job.json 

在这里插入图片描述

ps.如果是自己新增插件 需要修改项目中的 package.xmlpom.xml

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2 安装datax-web

https://github.com/WeiYe-Jing/datax-web/blob/master/doc/datax-web/datax-web-deploy.md

https://github.com/WeiYe-Jing/datax-web/blob/master/userGuid.md

datax-web集群部署 一个datax-web和多个datax-executor。确认datax安装的路径都是一样

启动datax-executor命令

./bin/stop.sh -m datax-executor

在这里插入图片描述

在这里插入图片描述

通过 module 下的 bin 下的日志能查到日志文件

在这里插入图片描述

1、通过界面的执行器管理能查到

在这里插入图片描述

2、data-web使用

data-web 的任务构建是负责自动生成dataX用的json文件,如果已经有json文件 就不需要使用。

3、data-web简要使用
  • 新建项目管理

在这里插入图片描述

  • 查看执行器管理
    在这里插入图片描述

  • 新建 任务管理
    在这里插入图片描述

  • 执行任务、查看日志

在这里插入图片描述

在这里插入图片描述

4、报错小记

在读mysql报错
在这里插入图片描述

在jdbc url增加配置 在没有服务器身份验证的情况下建立SSL连接\设置useSSL=false来显式禁用SSL

jdbc:mysql://hostname:port/tsp-cloud?useSSL=false&useUnicode=true&characterEncoding=utf8

rl增加配置 在没有服务器身份验证的情况下建立SSL连接\设置useSSL=false来显式禁用SSL

jdbc:mysql://hostname:port/tsp-cloud?useSSL=false&useUnicode=true&characterEncoding=utf8
http://www.mmbaike.com/news/67586.html

相关文章:

  • 万全网站建设wl17581竞价托管外包
  • 门户网站建设的平台原创代写文章平台
  • 电子商务网站建设源码上海推广网络营销咨询热线
  • 创意设计赛道具体赛题是什么seo基础
  • 知名网站的org域名网站建设深圳公司
  • 网站方案原则模板网站建站哪家好
  • 科技企业网站源码百度站长工具数据提交
  • 伪静态wordpress东莞关键词排名优化
  • 哪个网站可以做体育主播百度投诉中心热线
  • 微信公众号影视网站怎么做手机网页制作软件
  • 关于建设工程如何监管的网站目前最好的引流推广方法
  • 好大夫官方网站网上预约挂号深圳外贸网站推广
  • 怎样制作html个人网站南京seo网站优化推广
  • 最主流的网页制作软件seo网站优化是什么
  • asp做微网站建立网站平台需要多少钱
  • 辽宁同鑫建设有限公司网站关键词优化报价
  • ipfs做网站火星培训机构收费明细
  • 如何搭建个人博客新站seo外包
  • 网站建设公司 佛山网站seo博客
  • 用html做网站代码seo检测优化
  • WordPress tag 目录seo优化排名推广
  • 做网站 数据库建站为应用技术
  • 做钢材的都用什么网站百度网盘app下载安装手机版
  • 专业做网站系统西安网站开发制作公司
  • 为企业做贡献的文章泸州网站优化推广
  • 怎么从阿里巴巴做网站seo推广策划
  • 营销型网站有哪些代表seo管理系统培训
  • 网站建设 指标创建网站花钱吗
  • 可以做英语阅读理解的网站广州网络科技有限公司
  • 盐城高端网站制作公司百度网盘app官网