当前位置: 首页 > news >正文

做一个小公司网站多少钱百度指数查询官方下载

做一个小公司网站多少钱,百度指数查询官方下载,新电商网站,百度排名优化软件文章目录 一 数据导论二 大数据的诞生三 大数据概论3.1 大数据的5V特征3.2 大数据的工作核心 四 大数据软件生态4.1 数据存储软件4.2 数据计算软件4.3 数据传输软件 五 Apache Hadoop概述5.1 Apache Hadoop框架5.2 Hadoop的功能5.3 Hadoop的发展5.4 Hadoop发行版本 一 数据导论…

文章目录

  • 一 数据导论
  • 二 大数据的诞生
  • 三 大数据概论
    • 3.1 大数据的5V特征
      • 3.2 大数据的工作核心
  • 四 大数据软件生态
    • 4.1 数据存储软件
    • 4.2 数据计算软件
    • 4.3 数据传输软件
  • 五 Apache Hadoop概述
    • 5.1 Apache Hadoop框架
    • 5.2 Hadoop的功能
    • 5.3 Hadoop的发展
    • 5.4 Hadoop发行版本

一 数据导论

  • 数据:一种可以被鉴别的对客观事件进行记录的符号。简单来说就是:对人类的行为及产生的事件的一种记录。
  • 数据的价值:数据的背后都会隐藏着巨大的价值,丰富的数据支撑可以让我们更好的了解,事和物在现实世界的运行规律

  • 大数据时代:当下时代已经是数据的时代,数据非常重要并且蕴含巨大的价值
  • 大数据技术栈:对超大规模的数据进行处理并挖掘出数据背后的价值的技术体系

二 大数据的诞生

  • 大数据的诞生和信息化以及互联网的发展是密切相关的。
    在这里插入图片描述
  • 早期的计算机(上世纪70年代之前)大多数是相互独立的,各自处理各自的数据
    在这里插入图片描述
  • 上世纪70年代后,逐步出现了基于TCP/IP协议的小规模的计算机互联互通。但多数是军事、科研等用途
    在这里插入图片描述
  • 上世纪90年代左后,全球互联的互联网出现。个人、企业均可参与其中,真正逐步的实现了全球互联
    在这里插入图片描述
  • 在2000年后,互联网上的商业行为剧增。在互联网参与者众多的前提下,商业公司、科研单位等,所能获得的数据量也是剧增。
    在这里插入图片描述
  • 剧增的数据量,和羸弱的单机性能,让许多科技公司开始尝试以数量来解决问题。
    在这里插入图片描述
    在这里插入图片描述
  • 2008年之前,这些在当时较为”高端”的分布式技术基本上还处于大企业内部专用且不够成熟。
    在这里插入图片描述
  • 2008年 Apache Hadoop开源广大企业拥有了成熟的、开源的、分布式数据处理解决方案

Apache Hadoop 是一款开源的分布式处理技术栈为业界提供了

  • 基于Hadoop HDFS的:分布式数据存储技术
  • 基于Hadoop MapReduce的:分布式数据计算技术
  • 基于Hadoop YARN的:分布式资源调度技术
    Apache Hadoop的出现具有非常重大的意义:
  • 为业界提供了”第一款”企业级开源大数据分布式技术解决方案
  • 从Hadoop开始,大数据体系逐步建成,各类大数据技术不断出现
    在这里插入图片描述

三 大数据概论

  • 大数据的出现,本质上是为了解决海量数据的处理难题。
  • 大数据就是:使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值。
    在这里插入图片描述
  • 狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系。
  • 广义上:大数据是数字化时代、信息化时代的基础(技术)支撑,以数据为生活赋能。

3.1 大数据的5V特征

在这里插入图片描述
在这里插入图片描述

3.2 大数据的工作核心

  • 大数据的核心工作其实就是:从海量的高增长、多类别、低信息密度的数据中挖掘出高质量的结果
    在这里插入图片描述

四 大数据软件生态

在这里插入图片描述
大数据的核心工作:

  • 存储:妥善保存海量待处理数据
  • 计算:完成海量数据的价值挖掘
  • 传输:协助各个环节的数据传输
  • 所以大数据软件生态也是围绕工作重心展开的

4.1 数据存储软件

  • Apache Hadoop - HDFS
    在这里插入图片描述
    Apache Hadoop框架内的组件HDFS是大数据体系中使用最为广泛的分布式存储技术

  • Apache HBase
    在这里插入图片描述
    Apache HBase是大数据体系内使用非常广泛的NoSQL KV型数据库技术HBase是基于HDFS之上构建的。

  • Apache KUDU
    在这里插入图片描述
    Apache Kudu同样为大数据体系中使用较多的分布式存储引擎

  • 云平台存储组件
    各大云平台厂商也有相应的大数据存储组件,如阿里云的OSS、UCloud的US3、AWS的S3、金山云的KS3等等

4.2 数据计算软件

  • Apache Hadoop - MapReduce
    在这里插入图片描述
    • Apache Hadoop的MapReduce组件是最早一代的大数据分布式计算引擎对大数据的发展做出了卓越的贡献

  • Apache Hive
    在这里插入图片描述
    • Apache Hive是一款以SQL为要开发语言的分布式计算框架。其底层使用了Hadoop的MapReduce技术
    • Apache Hive至今仍活跃在大数据一线,被许多公司使用

  • Apache Spark
    在这里插入图片描述
    • Apache Spark是目前全球范围内最火热的分布式内存计算引擎。是大数据体系中的明星计算产品

  • Apache Flink
    在这里插入图片描述
    • Apache Flink同样也是一款明星级的大数据分布式内存计算引擎。特别是在实时计算(流计算)领域,Flink占据了大多数的国内市场。

4.3 数据传输软件

  • Apache Kafka
    在这里插入图片描述
    • Apache Kafka是一款分布式的消息系统,可以完成海量规模的数据传输工作。
    • Apache Kafka在大数据领域也是明星产品

  • Apache Pulsar
    在这里插入图片描述
    • Apache Pulsar同样是一款分布式的消息系统。在大数据领域同样有非常多的使用者。

  • Apache Flume
    在这里插入图片描述
    • Apache Flume是一款流式数据采集工具,可以从非常多的数据源中完成数据采集传输的任务。

  • Apache Sqoop
    在这里插入图片描述
    • Apache Sqoop是一款ETL工具,可以协助大数据体系和关系型数据库之间进行数据传输

五 Apache Hadoop概述

在这里插入图片描述

5.1 Apache Hadoop框架

  • Hadoop是Apache软件基金会下的顶级开源项目,用以提供:分布式数据存储、分布式数据计算、分布式资源调度为一体的整体解决方案。
  • Apache Hadoop是典型的分布式软件框架,可以部署在1台乃至成千上万台服务器节点上协同工作。个人或企业可以借助Hadoop构建大规模服务器集群,完成海量数据的存储和计算。

5.2 Hadoop的功能

  • 通常意义上,Hadoop是一个整体,其内部还会细分为三个功能组件,分别是:
    在这里插入图片描述
  • Hadoop是一个集合了:存储、计算、资源调度为一体的大数据分布式框架

5.3 Hadoop的发展

  • Hadoop创始人:Doug Cutting
    在这里插入图片描述
  • Hadoop起源于Apache Lucene子项目:Nutch
    • Nutch的设计目标是构建一个大型的全网搜索引擎。
    • 遇到瓶颈:如何解决数十亿网页的存储和索引问题
  • Google三篇论文
    • 《The Google file system》:谷歌分布式文件系统GFS
    • 《MapReduce: Simplified Data Processing on Large Clusters》:谷歌分布式计算框架MapReduce
    • 《Bigtable: A Distributed Storage System for Structured Data》:谷歌结构化数据存储系统

在这里插入图片描述

5.4 Hadoop发行版本

在这里插入图片描述

  • Apache开源社区版本
  • 商业发行版本
    • CDH(Cloudera’s Distribution, including Apache Hadoop) Cloudera公司出品,目前使用最多的商业版
    • HDP(Hortonworks Data Platform),Hortonworks公司出品,目前被Cloudera收购
    • 星环,国产商业版,星环公司出品,在国内政企使用较多
http://www.mmbaike.com/news/32524.html

相关文章:

  • 网页.网站.主页.网址.域名有什么联系朋友圈广告投放平台
  • 附近的计算机培训班seo怎么优化方案
  • 做老电影网站侵权吗最近的国际新闻
  • php做网站的公司有哪些最近新闻小学生摘抄
  • 中央电视台新闻联播seo优化一般包括
  • 新河网站建设上海搜索排名优化
  • 张家港早晨网站制作新浪网今日乌鲁木齐新闻
  • 网站维护运营优化公司广告精准推广平台
  • 怎样在微信做产品网站东莞网络推广公司
  • 北票网站建设杭州seo公司
  • 镇江网站建设价格营销方式和渠道有哪些
  • 长沙专业做网站公司网站seo排名优化
  • 帮人做钓鱼网站的人荆门今日头条新闻发布
  • 网页游戏广告平台网站建设十大互联网广告公司
  • 制作营销网站模板免费下载优化设计答案大全英语
  • 旅游网站建设公司2021百度最新收录方法
  • 发布外链网站seo的方法有哪些
  • 企业网站设计营销青岛网站建设公司排名
  • 用asp.net做网站网上推广平台有哪些
  • 网站如何做视频的软件2024北京又开始核酸了吗今天
  • wordpress menu css广州seo服务外包
  • 网上商店系统设计软件优化
  • 给千图网等网站做设计赚钱吗西安百度代运营
  • 做推广秒杀网站互联网推广工作好做吗
  • 免费域名注册方式百度快照优化排名
  • 网站干什么的seo快速排名利器
  • 公司网站制作合同市场推广计划书
  • 建设第二个北京在哪里网站快速优化排名官网
  • dede做的网站被植入广告百度一下你就知道官网网页
  • 只有做推广才能搜索到网站吗网络营销手段有哪四种