更新时间:2024-12-24
大数据处理和所有权造成存储行业现状再次发生改变。本文讲解了存储实践中方面最根本性的变化。
企业存储环境主要是环绕记录系统建构一起的,侧重于这些问题:为数据记录长度相同的文件出售哪些类型的存储介质和管理系统,所存储数据的性质是动态数据、定动态数据,还是只是有时候必须采访或几乎可以用数据文档保存起来的批量填满的数据等。 自从大数据转入企业数据中心和业务部门,一切转变了――单个的大数据文件可以用数TB、甚至数PB来取决于。Hadoop等分析平台上的大数据并行处理与事务数据的按顺序处置具有显著区别。不出所料,存储方面要考虑到的因素随之变化。
这种变化在数据分析和高性能计算出来领域反映得尤为显著。这个领域以Hadoop应用程序居多,它们利用算法分析方法并行处理数PB级数据,用作数据科学及其他简单查找。就高性能应用程序而言,很难考虑到像虚拟化存储或基于云的存储这些概念,因为你只有通过数据中心的物理处理器和存储平台,才能必要处置并存储数据和查找结果。
因此,这种工作具备的计算出来密集性和存储密集性使数据中心管理人员(还包括存储专业人员)仍然像过去十年那样,急迫谋求的虚拟化或云计算。作为大数据对象存储特点的单一数据集的可观性也是如此,它们用于元数据标签来叙述非传统数据图像,比如照片、视频、音频记录和文档图像等。 此外,大数据项目的所有权也转变了存储计算出来。如果公司里面的业务部门在运营大数据项目,其目标就不会改向零散的分布式物理存储架构,这些分布式物理存储是网络可选存储(NAS),可以在工作阻抗必须时,向外扩展到多个存储设备。
分布式向外拓展型NAS是基于云的存储或虚拟存储之外的一种自由选择,它与这些风行的IT趋势构成了独特对照。 鉴于这些发展动向,云计算在大数据领域可以扮演着什么角色呢? 答案是冻存储(coldstorage),这个领域仍没获得企业界的充分利用。冻存储是极为低廉、速度极快、待命在磁盘的数据,存储一起放在文档上,适当保存起来。
在日常的IT中,这些数据很少有机会必须中用,所以如果你把它移往到异地数据存储库很便利,不用让它在你的数据中心或运营系统中占用空间。如果该数据存储库在云端,你就需要从数据中心远程访问它,没有适当大老远跑到异地拿起磁盘或磁带。 云计算和虚拟存储在数据集市也不存在发展前景。
现在许多公司用于数据集市为有所不同的部门运营批量查找。数据集市中所用的数据大多是批量创立,基本是过去用来查找的传统数据。不同之处在于,用户现在享有比过去更好的分析报告创立工具和选项用作查找,而且数据管理员更加需要分解从有所不同来源单体的数据。
在这种批量环境下,磁盘存储解决方案用一起就跟过去一样有效地。 存储管理员必须应付大数据带给的变化,特别是在是如何应付众多极为可观的大数据文件。这就必须专门的磁盘和处置,在大多数情况下,还必须与云计算和虚拟化项目背道而驰的本地存储。
在另一方面,商用冻存储解决方案可能会最后避免这个困境:很少用于的数据待命在机房的过时磁盘和磁带驱动器上,无人照管。
本文来源:188BET金宝搏-www.hnzj2020.com