大数据学习：大数据当中要用到高并发吗？

作者：张老师浏览次数： 2021-03-01 17:42

提到大数据，分布式、高并发是常常被提到的两个名词，分布式与高并发，与大数据之间，到底存在什么样的联系呢？大数据当中要用到高并发吗？今天的大数据学习分享，我们就主要来讲讲这两个问题。

一、什么是高并发？

高并发（High Concurrency）是大数据分布式系统架构设计中必须考虑的因素之一，它通常是指，通过设计保证系统能够同时并行处理很多请求。

高并发相关常用的一些指标有响应时间（Response Time），吞吐量（Throughput），每秒查询率QPS（Query Per Second），每秒事务处理量TPS(Transaction Per Second)，并发用户数等。

二、如何提升系统的并发能力

大数据分布式架构设计，提高系统并发能力的方式，方法论上主要有两种：垂直扩展（Scale Up）与水平扩展（Scale Out）。

（1）垂直扩展：提升单机处理能力。垂直扩展的方式又有两种：

①增强单机硬件性能，例如：增加CPU核数如32核，升级更好的网卡如万兆，升级更好的硬盘如SSD，扩充硬盘容量如2T，扩充系统内存如128G；

②提升单机架构性能，例如：使用Cache来减少IO次数，使用异步来增加单服务吞吐量，使用无锁数据结构来减少响应时间；

（2）水平扩展：只要增加服务器数量，就能线性扩充系统性能。

水平扩展对系统架构设计是有要求的，如何在架构各层进行可水平扩展呢？

三、分布式水平扩展的设计

1、系统集群化部署+负载均衡

（1）添加负载均衡层，将请求均匀打到系统层。

（2）系统层采用集群化多活部署，扛住初步的并发压力。

2、数据库分库分表+读写分离+分布式数据库

（1）分库分表：水平拆分、垂直拆分（弊端太多如关联查询）。

（2）读写分离：主库写，从库读（数据同步延迟）。

（3）分布式数据库：TiDB（HTAP、兼容MySQL协议、水平扩展、分布式事务）

3、缓存

（1）本地缓存：本地磁盘或内存。

（2）分布式缓存：用缓存集群抗住大量的读请求。

（3）预缓存，多级缓存。

4、消息中间件

（1）系统解耦，数据同步。

（2）请求异步化处理，实现削峰填谷的效果。

5、应用拆分（微服务）

（1）按业务拆分、减少耦合。

（2）分级部署，扩容缩容。

（3）应用资源隔离。

6、CDN（内容分发网络）

（1）尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节，使内容传输的更快更稳定。

（2）CDN能够实时地根据网络流量和各节点的链接，负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。

关于大数据学习，大数据当中要用到高并发吗，以上就为大家做了简单的介绍了。大数据分布式系统架构当中，高并发是必须要考虑的一个指标，而水平分布式扩展，是目前的主流解决方案之一。成都加米谷大数据，专业大数据培训机构，大数据开发、数据分析与挖掘，零基础班本月正在招生中，课程大纲及学习视频，可联系客服获取！

标签：大数据学习分布式高并发

上一篇：大数据开发：为你详解NoSQL
下一篇：大数据学习：高并发的几种主流解决思路

相关推荐

大家都在看

热点排行

推荐文章