从硬件角度讲解 分布式存储是什么?
什么是分布式存储系统?
分布式存储又称去中心化存储,要理解它,首先我们需要了解中心化存储。中心化存储,从概念上可以看出来是具有集中性的,也就是整个存储是集中在一个系统中的,但集中式存储并不是一个单独的设备,是集中在一套系统当中的多个设备。这个存储设备虽然可以纵向扩展,但还是共享同一个机头,设备本身会成为系统性能的瓶颈,同时也是系统可靠性和安全性的焦点,无法满足大规模存储应用的需要。
在这个存储系统中包含很多组件,除了核心的机头(控制器)、磁盘阵列(JBOD)和交换机等设备外,还有管理设备等辅助设备。
结构中包含一个机头,这个是存储系统中最为核心的部件。通常在机头中有包含两个控制器,互为备用,避免硬件故障导致整个存储系统的不可用。机头中通常包含前端端口和后端端口,前端端口用户为服务器提供存储服务,而后端端口用于扩充存储系统的容量。通过后端端口机头可以连接更多的存储设备,从而形成一个非常大的存储资源池。
在整个结构中,机头中是整个存储系统的核心部件,整个存储系统的高级功能都在其中实现。控制器中的软件实现对磁盘的管理,将磁盘抽象化为存储资源池,然后划分为LUN提供给服务器使用。这里的LUN其实就是在服务器上看到的磁盘。当然,一些集中式存储本身也是文件服务器,可以提供共享文件服务。无论如何,从上面我们可以看出集中式存储最大的特点是有一个统一的入口,所有数据都要经过这个入口,这个入口就是存储系统的机头。这也就是集中式存储区别于分布式存储最显著的特点。
分布式存储系统是将数据分散存储在多台独立的设备上,并且能够横向扩展,利用多台存储设备分担存储负荷,利用元数据服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。同时,可以将这些分散的存储设备构建成一个虚拟的大存储池,供上层应用来使用。市场上诸多集群存储、并行存储,云存储等,其实都是基于分布式的架构,只是厂商不同叫法不同。最近几年,这种分布式架构的存储系统正在逐步替代传统的存储架构,尤其是在非结构化数据的存储领域发展非常迅猛。
分布式存储最早是由谷歌提出的,其目的是通过廉价的服务器来提供使用与大规模,高并发场景下的Web访问问题。它采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
分布式存储系统特点
1、大容量:系统节点可采用通用的X86架构存储服务器作为构建单元,可根据用户需要横向无限扩展存储节点,并且形成一个统一的共享存储池。
2、高性能:相比传统存储而言,分布式存储系统能提供高出数倍的聚合IOPS和吞吐量,另外可以随着存储节点的扩容而线性增长,专用的元数据模块可以提供非常快速精准的数据检索和定位,满足前端业务快速响应的需求。
3、更可靠:整个系统无任何的单点故障,数据安全和业务连续性能够得到保障。每个节点可看成是一块硬盘,节点设备之间有专门的数据保护策略,可实现系统的设备级冗余,并且可在线更换损坏的硬盘或者节点设备。
4、易扩展:系统可以支持在线无缝动态横向扩展。在采用冗余策略的情况下,任何一个存储节点的上线和下线对前端业务没有任何影响,完全是透明的。并且系统在扩充新的存储节点后,可以选择自动负载均衡,所有数据压力会均匀分配在各存储节点上。
5、易整合:兼容任何品牌的X86架构通用存储服务器,在标准的IP/IB网络环境下即可轻松实施,无须改变原有网络架构。
6、易管理:通过一个简单的Web界面就可以对整个系统进行配置管理,运维简便,极低的管理成本,一个管理员就可以轻松管理PB级别的存储系统。
微信扫描关注公众号,及时掌握新动向
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场