大数据分析平台有哪些功能

来源:中琛源 浏览次数: 更新时间:2020-03-26 09:25:41

  大数据平台:是指以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。


  大数据平台的功能:


  1、容纳海量数据


  利用计算机群集的存储和计算能力。不仅在性能上有所扩展,而且其处理传入的大量数据流的能力也相应提高。


  2、速度快


  结合列式数据库架构(相对于基于行的非并行处理传统数据库)和使用大规模并行处理技术,不仅能够大幅提高性能(通常约100到1000倍),还可以实现更低且更透明的定价机制。


  3、兼容传统工具


  确保平台已经过认证,可以兼容传统工具。


  4、利用Hadoop


  Hadoop已成为大数据领域中的主要平台。利用Hadoop作为用于持久性和轻量型数据管理的高效益平台。


  5、为数据科学家提供支持


  数据科学家在企业IT中拥有着更高的影响力和重要性,快速、高效、易于使用和广泛部署的大数据平台可以帮助拉近商业人士和技术专家之间的距离。


  6、提供数据分析功能


  确保大数据平台不仅支持在数秒钟内准备并加载数据,还支持利用高级算法建立预测模型,轻松部署模型以进行数据库内计分。同时使数据科学家能够使用现有统计软件包和首选语言。


  如何搭建大数据分析平台?


  一般性步骤:


  1、Linux系统安装


  2、分布式计算平台/组件安装


  当前分布式系统的大多使用的是Hadoop系列开源系统


  3、数据导入


  数据导入的工具是Sqoop


  4、数据分析


  数据分析一般包括两个阶段:数据预处理和数据建模分析。


  数据预处理这个过程可能会用到Hive SQL,Spark QL和Impala。


  数据建模分析最好用的是Spark


  5、结果可视化及输出API


  可视化一般式对结果或部分原始数据做展示。


  在搭建大数据分析平台之前,要先明确业务需求场景以及用户的需求,通过大数据分析平台,想要得到哪些有价值的信息,需要接入的数据有哪些,明确基于场景业务需求的大数据平台要具备的基本的功能,来决定平台搭建过程中使用的大数据处理工具和框架。

上一篇:大数据分析需要具备什么工具
来源:中琛源
更新时间:2020-03-26 09:10:37
下一篇:数据治理对建设大数据平台有什么影响
来源:中琛源
更新时间:2020-03-26 09:31:50