当前位置: 首页 > news >正文

公司招聘网站续费申请站内seo的技巧

公司招聘网站续费申请,站内seo的技巧,营销与运营的关系,太原市住房和城乡建设厅网站前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…

前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的

于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件

在反反复复测试调整以后, 我发现问题出在这里:

隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive)
假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选

-- 
select x
from t1,t3,t2
where t1.id = t2.t1_id 
and t2.id = t3.t2_id

比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联.

但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样
在这里插入图片描述

最后改为正确的顺序, 从1天多变成了二几分钟.搞定
在这里插入图片描述

结论

  1. hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写
  2. 建议用显式join查询
  3. 写完hive脚本测试跑一次看看效率,不确定就explain
http://www.mmbaike.com/news/22128.html

相关文章:

  • 什么叫动漫设计与制作seo点击排名源码
  • wordpress 域名插件seo推广哪家服务好
  • 网站维护 关站 seoseo自然排名关键词来源的优缺点
  • wordpress会员支付系统郑州百度seo关键词
  • 如何在网站标题加logo广告平台网
  • 一个网站怎么做后台软文推广系统
  • a网站建设软文广告范文
  • 网站开发与设计的实训场地google登录
  • 住房和城乡建设部网站建造师佛山百度关键词排名
  • 网站点击推广太原seo网络优化招聘网
  • 有专业做网站优化的吗崇左网站建设
  • 成都市四方建设工程监理有限公司网站合肥网站关键词优化公司
  • Python用数据库做网站白百度一下你就知道
  • 杭州智能模板建站广告推广费用一般多少
  • 北辰正方建设集团有限公司官方网站seo搜索优化
  • 怎么做网页制作网站模板如何创建网站的快捷方式
  • 那些外贸网站个人可以做武汉最新消息今天
  • 万户网络销售windows优化大师收费
  • 新疆网站设计淘宝指数官网入口
  • 做设计在哪个网站接单一个网站如何推广
  • 美食网站程序搜索热度和搜索人气
  • 怎样做原创短视频网站怎么做手工
  • 微博营销网站源码百度怎么推广产品
  • html5网站开发泰安seo排名
  • 做本地的门户网站苏州推广排名
  • 宠物网站建设方案书seo搜索引擎优化工程师招聘
  • 网站设计专题页竹子建站官网
  • 可以做内容的网站长沙网址seo
  • 网站前端设计与制作ppt什么是全网营销推广
  • id如何打开wordpressseo服务深圳