主页 > 新闻资讯 > 大数据基础知识要点:大数据与大数据技术

大数据基础知识要点:大数据与大数据技术

作者:张老师 浏览次数: 2020-07-24 18:09
当我们谈到大数据时,其实往往并不是指数据本身,更多的指的是数据和大数据技术的结合。大数据要实现处理,需要大数据技术来提供支持,而掌握大数据技术的专业人才,是主力队伍。今天我们就来讲讲大数据基础知识要点,大数据与大数据技术。

发展到如今,大数据技术已经进入了比较稳定的阶段,随着大数据的落地实践,主流的大数据技术框架,在实践当中的优缺点,都已经得到认知,只需要根据实际的需求,去选用合适的框架,然后快速搭建起大数据系统平台。

大数据基础知识要点

大数据技术从数据处理的流程来看,可以分为几个大的阶段——

①数据采集与预处理:

利用ETL工具将分布的、异构数据源中的数据,如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或者数据集市中,成为联机分析处理、数据挖掘的基础;也可利用日志采集工具(如Flume、Kafka等)把实时采集的数据作为流计算系统的输入,进行实时处理分析。

②数据存储与管理:

利用分布式文件系统、数据仓库、关系数据库、NoSQL数据库、云数据库等,实现对结构化和非结构化海量数据的存储和管理。

③数据处理与分析:

利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析。

④数据可视化呈现:

采用可视化工具,对数据分析结果进行可视化呈现,帮助人们更好地理解数据和分析数据。

而大数据处理的核心,大数据计算引擎,按照不同的场景,也有分类——

批处理引擎:代表产品MapReduce和Spark等;

流处理引擎:代表有开源的Storm、S4、Spark Streaming,商用的Streams、StreamBase等;

交互式查询计算引擎:代表有Dremel、Impala、Cassandra、Hive等;

图计算引擎:代表有Pregel、GraphX、Giraph以及PowerGraph等。

关于大数据基础知识要点,大数据与大数据技术,以上就为大家做了一个简单的汇总了。大数据技术体系庞杂,想要真正学到家,还是要付出足够的时间和精力去钻研的。成都加米谷大数据,专业大数据培训机构,大数据开发技术培训,零基础班本月正在招生中,课程大纲及试学视频可联系客服领取!
热点排行
推荐文章
立即申请>>