大数据开发_加米谷大数据-大数据学习培训|大数据培训机构|数据分析师培训学校|成都大数据培训班

想要高薪职位？先学大数据技术

加米谷
大数据

市面大数据培训占比

市面上大数据培训鱼龙混杂，有Java、PHP、数据库大数据等，但真正大数据是hadoop、spark、storm、超大集群调优、机器学习、Docker容器引擎、 ElasticSearch、并发编程等，别人不能讲的我们讲，别人能讲的我们讲得很深入。
真正大数据市场价值很高

以北京为例，真正大数据工程师平均年薪达201640-451670

大数据工程师人才缺口大

数据表明，近几年间大数据人才缺口就已高达百万，目前企业高薪都难以找到足够的大数据开发人才，大数据从业者的增长量，远远满足不了市场需求的扩张，大数据人才需求将出现“井喷”现象
大数据工程师发展空间巨大

大数据行业应用广泛，大数据职业的相关人才匮乏，人才缺口非常大。职业选择多达几十种，要升职加薪很容易！可以说，未来的大数据工作，就意味着高薪、稳定、广泛的职业使用度、优越感……

加米谷大数据课程，贴合企业用人需求

学员起薪8K+，丰富项目实战，可考取大数据相关证书中国科学管理研究院提供证书，全国通用

了解证书详情 >>

大数据培训，我们首先看课程专业度

国家大数据标准组成员+企业大数据总架构师+企业项目经理联合研发课程（万行级代码，企业真实项目实战）

第一阶段 （Java设计与 编程思想）

Java基础

1、Java是什么类型语言，Java语言的编译、解释、执行过程
2、Java运行环境的安装和配置
3、标识符与关键字
4、基本数据类型
5、方法初识
6、运算符与表达式
7、分支语句
8、循环语句
9、Math、Date、Random
Java面向对象

1、什么是面向对象
2、类、对象、数组
3、介绍面向对象多态
4、抽象类的概念
5、抽象类的声明语法
6、抽象类被继承
7、接口的声明语法
8、实现接口的实现类
9、普通类与抽象类思想上的区别
10、抽象类与接口思想上的区别
Java高级

1、异常处理
2、I/O、JavaBean
3、反射/多线程
4、网络编程
5、泛型和集合
数据库与JDBC

1、安装与介绍
2、创建数据库与表
3、表与表之间关系
4、字段类型/函数/查询语句
5、存储器/触发器
6、增删改查
7、事务并发
8、操作存储器和触发器

第二阶段 （Web前端开发）

HTML基础

1、Web开发简介
2、开发环境介绍
3、html与css编程介绍
4、JavaScript编程介绍
5、头部标记/文字格式标记
6、字体/列表/图像标记
7、超链接/表格/表单
8、框架
CSS3

1、web标准
2、css语法基础与选择器
3、css继承与优先级
4、css编写原则
5、css属性与浮动
6、css盒子模型
7、css定位
JS脚本编程

1、JavaScript定义
2、JavaScript特点与核心
3、JavaScript开发环境
4、JavaScript基本使用
5、DOM介绍与节点相关操作
6、DOM类型与操作
7、DOM获取表格元素
8、DOM获取元素样式
事件与JQuery框架

1、事件介绍与内联模型
2、脚本模型与事件对象
3、键盘事件与鼠标事件
4、JQuery基本语法
5、JQuery常用选择器
6、JQuery事件处理
7、JQuery文档操作

第三阶段 （JavaEE进阶）

Web环境配置

1、Tomcat服务器
JavaWeb开发核心

1、JSP&Servlet基础
2、JSP&Servlet高级
SSM框架

1、SpringIOC
2、SpringAOP
3、SpringMVC配置文件详解
4、OGNL详解
5、控制器的实现
6、注解方式实现
7、文件上传与下载
8、拦截器详解
9、表单验证流程详解
10、SSM + Jquery + Ajax整合开发
Mysql

1、数据库基础知识
2、SQL理论基础和数据类型
3、DDL、LML、DQL语句
4、函数和关联查询
5、子查询、约束、视图
6、编程存储过程，触发器
7、Sql查询案例和优化

第四阶段 （大数据基础：Linux 基础、Maven基础）

Linux系统管理

1、Linux安装
2、用户与用户组管理
3、文件操作
4、目录操作
5、RPM安装与卸载
6、YUM安装与卸载
7、打包、压缩与解压缩
8、网络配置(network)
9、后台运行程序（nohup & ;）
Shell编程设计

1、Shell是什么
2、Shell分类
3、基本语法与环境变量
4、预定义变量
5、用户变量
6、特殊符号使用
7、逻辑判断与流程控制
8、正则表达式
9、模式匹配 10、Grep使用
Maven部署/配置/仓库

1、Maven部署
2、Maven配置
3、Maven安装目录解析
4、Maven本地仓库与中央仓库
5、Maven远程仓库
6、Maven 私服
7、如何从Maven远程仓库下载
8、Maven添加远程仓库
9、部署至远程仓库
10、Maven镜像
Maven POM

1、Maven核心元素
2、Maven核心插件/坐标/依赖
3、Maven依赖范围
4、Maven传递性依赖
5、Maven依赖调解/可选依赖/排除依赖
6、Maven快照及发布版本
7、Maven聚合与继承
8、Maven依赖管理与插件管理
9、Maven反应堆与灵活构建

第五阶段 （HDFS分布式文 件系统）

HDFS原理剖析

1、HDFS概念
2、HDFS内核/读写原理
3、HDFS数据块
4、HDFS数据副本的存放策略
5、HDFS安全模式/负载均衡/机架感应
6、HDFS名称节点NameNode
7、HDFS第二名称节点SecondNameNode
8、HDFS高可用HA/联邦Federation
HDFS 编程实践

1、HDFS分布式文件读取
2、HDFS写入剖析/读取剖析组
3、HDFS一致模型/数据完整性
4、HDFS压缩/序列化
5、HDFS基于文件的数据结构
6、HDFS数据备份/网络拓扑
7、HDFS集群的构建和安装
8、HDFS配置管理/环境设置/安全性
9、文件系统操作Hadoop fs与hdfs dfs

第六阶段+第七阶段+ 第八阶段 （MapReduce分布 式计算模型+Yarn分 布式资源管理器 +Zookeeper分布式 协调服务

MapReduce原理剖析

1、MapReduce产生背景
2、MapReduce适用场景
3、MapReduce基本原理
4、MapReduce作业执行流程
5、MapReduce基本组件
6、MapReduce JobTracker
7、MapReduce TaskTracker
MapReduce实践

1、MapReduce高级编程应用
2、MapReduce Combiner
3、MapReduce Partitioner
4、MapReduce性能优化技巧
5、MapReduce案例分析
6、MapReduce开发实践操作
Yarn原理剖析

1、Yarn架构设计
2、Yarn核心原理
3、Yarn主节点ResourceManager
4、Yarn从节点NodeManager
5、Yarn从节点Container
6、Yarn的Application
Zookeeper原理+实践

1、Zookeeper 介绍
2、Zookeeper核心原理
3、Zookeeper结构
4、Zookeeper Server
5、Zookeeper Client程
6、Zookeeper访问
7、Zookeeper常用访问工具

第九阶段+第十阶段 （Hbase分布式数据 库+Hive分布式数据仓库）

Hbase原理剖析

1、Hbase存储原理
2、Hbase列式存储原理
3、Hbase稀疏存储设计
4、Hbase KeyValue存储设计
5、Hbase数据多版本
6、Hbase Rowkey设计
7、Hbase 存储无模式设计
Hbase编程实战象

1、Hbase 访问Shell接口实践
2、Hbase 访问API接口实践
3、Hbase 实战训练/p>
Hive原理剖析

1、Hive介绍
2、Hive应用场景
3、Hive架构
4、Hive运行原理
5、Hive命名空间
6、Hive库的位置
7、Hive数据仓库
Hive实践

1、Hive创建库
2、Hive修改库与删除库
3、Hive普通表与带分区的表
4、Hive带Bucket的表/外部表/相似表
5、Hive分区/Bucket管理/向Hive表中装载与插入数据
6、创建并加载数据到Hive表与导出数据
7、Hive SelectFrom/Where/GroupBy/Join

第十一阶段+第十二 阶段 （FlumeNG分布式数据采集系统+Sqoop大数据迁移系统）

FlumeNG原理剖析

1、FlumeNG概述
2、FlumeNG部署配置
3、FlumeNG分布式架构
4、FlumeNG应用场景
5、FlumeNG与同类产品的优缺点
6、FlumeNG工作原理
7、FlumeNG运行时系统实现的逻辑
FlumeNG实践

1、FlumeNG指定文件数据作为数据源
2、FlumeNG监测并读取新增文件数据作为数据源
3、FlumeNG命令输出作为数据源
4、FlumeNG监听TCP的端口作为数据源
5、FlumeNG获取HTTP数据作为数据源
6、FlumeNG HDFS作为输出源
7、FlumeNG本地目录作为输出源
Sqoop原理剖析

1、Sqoop介绍
2、Sqoop架构原理/p>
Sqoop实践

1、数据迁入大数据存储
2、数据迁出大数据存储

第十三阶段+第十四 阶段 （Scala大数据黄金语言+kafka分布式总线系统）

Scala语法剖析

1、Scala基础
2、Scala流程控制
3、Scala异常处理
4、Scala数据类型
5、Scala运算符
6、Scala函数基础
7、Scala匿名函数
8、Scala嵌套函数
9、Scala递归函数、部分应用函数、柯里函数、高阶函数
Scala应用实践

1、Scala闭包
2、Scala对象
3、Scala特征
4、Scala模式匹配
5、Scala隐式转换
6、Scala Lists
7、Scala Seqs
8、Scala Sets
9、Scala Maps
10、Scala Tuples、Scala Iterators、Scala Options
Kafka原理剖析

1、Kafka初识
2、Kafka主题
3、Kafka日志
4、Kafka生产者
5、Kafka消费者
6、Kafka消费组
7、Kafka消息读写原理
8、Kafka位移管理
9、Kafka副本机制、分布式、消息传送机制
Kafka实践

1、Kafka命令工具
2、Kafka生产API
3、Kafka消费API
4、Kafka实战训练

第十五阶段+第十六 阶段+第十七阶段 （SparkCore大数据计算基石+SparkSQL数据挖掘利器+SparkStreaming流式计算平台）

SparkCore核心原理

1、SparkCore 基础原理
2、SparkCore核心代码剖析
3、SparkCore运行架构
4、Rdd编程模型
5、Rdd内存弹性分布式数据集的工作原理和机制
6、RDD Transform
7、RDD Action
SparkSQL原理

1、SparkSQL简介
2、SparkSQL运行原理
3、SparkSQL程序开发光速入门
4、SparkSQL程序开发之数据源
5、SparkSQL程序开发之DataFrame态
6、SparkSQL程序开发之DataSet
7、SparkSQL程序开发之数据类型
8、SparkSQL实战训练
SparkStreaming原理

1、SparkStreaming原理
2、SparkStreaming与Storm 在流处理方面的比较
3、SparkStreaming与Spark 交互的实现机制
4、SparkStreaming核心代码剖析
SparkStreaming实践

1、SparkStreaming 滑动窗口
2、SparkStreaming foreachRDD
3、SparkStreaming 性能优化
4、SparkStreaming 持久化
5、SparkStreaming Checkpoint
6、SparkStreaming 容错
7、SparkStreaming 事务
8、SparkStreaming客户端编程实践

第十八阶段+第十九 阶段 （SparkMllib机器学习平台+SparkGraphx图计算平台）

SparkMllib算法模型原理

1、数据挖掘基础知识
2、机器学习基础知识
3、机器学习案例
4、Mahout/Spark MLib 并行挖掘平台中的关联规则
5、Mahout/Spark MLib 并行挖掘平台中的预测协同过滤
6、Mahout/Spark MLib 并行挖掘平台中的推荐模型
7、SparkMllib模型的原理
8、SparkMllib模型的算法实现
SparkMllib算法实践

1、推荐分析模块的深度剖析
2、推荐分析算法MapReduce并行实现及应用开发
3、关联规则挖掘算法Ma-
pReduce并行实现及应用开发
4、频繁模式挖掘算法的Ma-
pReduce并行实现及应用开发
5、回归预测的 MapReduce实现和Spark 实现技术
6、局部加权线性回归预测算法MapReduce、Spark实现技术
SparkGraphX核心原理

1、SparkGraphX基础原理
2、SparkGraphX核心代码剖析
SparkGraphX实践

1、SparkGraphX客户端 API 介绍
2、基于 Spark GraphX 实现图数据的分析程序开发

第二十阶段 （大数据项目实战）

电商数据离线分析平台

用SparkSQL、SparkStreaming，进行离线计算和实时计算业务模块的开发。实现了用户访问session 分析、页面单跳转化率统计、热门商品离线统计、广告点击流量实时统计4 个业务模块。合理的将实际业务模块进行技术整合与改造，项目完全涵盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架中几乎所有的功能点、知识点以及性能优化点
移动基站信号监测大数据

移动通信基站信号数据采集，实时分析及移动信号监测系统。该系统利用移动与联通两家运营商的信令数据，通过对基站信号大数据的实时提取与分析，结合基站信号覆盖模式、信号强弱、覆盖区域等实际情况，实时动态采集及分析监测置信度较高、精度较高的移动基站信号监测系统。
运维大数据平台

银行和金融服务行业相关系统每天产生数以 TB 计的交易、支付、渠道等各种日志数据。运维大数据平台为迅速增长的海量数据建立全新的处理策略和维护能力，应对日趋复杂的管理需求。运维大数据通过海量日志数据分析，可以帮助银行机构提高服务质量，占据竞争优势。
舆情大数据平台

舆情大数据监测平台系统是针对互联网新兴媒体，通过对海量网络舆论信息进行实时的自动舆情采集，舆情分析，舆情汇总，舆情监视，并识别其中的关键舆情信息，及时通知到相关人员，从而第一时间应急响应，为正确舆论导向及收集网友意见提供直接支持的一套信息化平台。

申请免费试听课程 >>

企业级项目实操，可接触项目底层代码

滴滴打车车辆与用户数据 京东电商用户画像分析平 基于分布式计算的用户行 天眼查企业征信大数据分 舆情大数据: 项目名称：　滴滴打车车辆与用户数据

项目简述：
本项目涉及用户画像对出行需求者和滴滴司机行为进行画像，并在海量数据中通过连接和匹配算法寻找可匹配的供需对象。

所用技术：Hadoop + MongoDB + Memcached + Ngnix + Mysql; 项目名称：　京东电商用户画像分析平

项目简述：
通过用户画像数据还原用户的属性特征、社会背景、兴趣爱好，甚至还能揭示内心需求、性格特点、社交人群等潜在属性。通过数据源、数据建模、数据集市等多方面的代码练习，了解用户画像过程及建模方式。

所用技术：HDFS + hbase + kafka + Flume + redis +Spark +storm; 项目名称：　基于分布式计算的用户行

项目简述：
电商平台用户行为分析，获取用户感兴趣或经常浏览的数据，并经过分布式计算，对所有用户的行为数据进行统计分析，智能化精准投放推荐商品及广告，能够可视化的方式展示用户的喜好等。

所用技术：websocket + kafka + Spark + flume + redis + hdfs + hive + echarts; 项目名称：　天眼查企业征信大数据分

项目简述：
本项目通过网络爬虫抓取公开的企业工商数据、法律诉讼信息、知识产权、商标专利等信息，并对数据进行关联细分数据可视化等操作，掌握Solr的使用方法和优化技巧。

所用技术：Client + HDFS + solr + MapReduce + Hbase + Spark; 项目名称：　舆情大数据

项目简述：
通过分布式爬虫，从互联网爬取海量数据，通过清洗、转换并挖缺出热点数据，能够对这些数据进行统计分析并对网络信息进行监控。

所用技术：Spark + mongodb + hdfs + yarn + hbase + kafka + redis