【数据密集型系统设计】软件系统的可靠性、可伸缩性、可维护性

本文链接：https://blog.csdn.net/hiliang521/article/details/139387879

文章目录

一. 数据密集型程序的特点以及遇到的问题
二. 可靠性 : 即使出现问题，也能继续正确工作
二. 可伸缩性
四. 可维护性

本文讨论了软件系统的可靠性，可伸缩性和可维护性。

可靠性（Reliability） 指高可用：及时发生故障（人为、bug、硬件服务）也能提供服务。一般高可用通过主备的概念去实现；

可伸缩性（Scalability） 负载增加的情况下也有保持性能的策略，一般进行横向拓展；

可维护性（Maintainability）：这里强调抽象降低复杂度，并易于修改和适应新的应用场景。

一. 数据密集型程序的特点以及遇到的问题

现今很多应用程序都是 数据密集型（data-intensive） 的，而非 计算密集型（compute-intensive） 的。因此 CPU 很少成为这类应用的瓶颈，更大的问题（是内存）通常来自数据量、数据复杂性、以及数据的变更速度。

标准组件提供了应用的能力
数据密集型应用通常由标准组件构建而成，标准组件提供了很多通用的功能。例如，许多应用程序都需要：

存储数据，以便自己或其他应用程序之后能再次找到（数据库，即 databases）

加快读取速度（缓存，即 caches）

允许用户按关键字搜索数据，或以各种方式对数据进行过滤（搜索索引，即 search indexes）

向其他进程发送消息，进行异步处理（流处理，即 stream processing）

定期处理累积的大批量数据（批处理，即 batch processing）