现在很多数据科学家都是在研究⼤数据的技术,很多⼈只是听过⼤数据这个词,但是对⼤数据还是不太了解的,对于⼤数据现在需要解决的关键问题不是很明朗。⽽今天我们就⼀起来了解⼀下,⼤数据技术应⽤过程中都出现了哪些问题需要解决。
⼤数据技术应⽤常见的⼋个问题分析
1、容量问题
这⾥所说的“⼤容量”通常可达到PB级的数据规模,因此,海量数据存储系统也⼀定要有相应等级的扩展能⼒。与此同时,存储系统的扩展⼀定要简便,可以通过增加模块或磁盘柜来增加容量,甚⾄不需要停机。在解决容量问题上,不得不提LSI公司的全新Nytro™智能化闪存解决⽅案,采⽤Nytro产品,客户可以将数据库事务处理性能提⾼30倍,并且超过每秒4.0GB的持续吞吐能⼒,⾮常适⽤于⼤数据分析。
2、延迟问题
“⼤数据”应⽤还存在实时性的问题。特别是涉及到与⽹上交易或者⾦融类相关的应⽤。有很多“⼤数据”应⽤环境需要较⾼的IOPS 性能,⽐如HPC⾼性能计算。此外,服务器虚拟化的普及也导致了对⾼IOPS的需求,正如它改变了传统IT环境⼀样。为了迎接这些挑战,各种模式的固态存储设备应运⽽⽣,
⼩到简单的在服务器内部做⾼速缓存,⼤到全固态介质可扩展存储系统通过⾼性能闪存存储,⾃动、智能地对热点数据进⾏读/写⾼速缓存的LSINytro系列产品等等都在蓬勃发展。
3、安全问题
某些特殊⾏业的应⽤,⽐如⾦融数据、医疗信息以及政府情报等都有⾃⼰的安全标准和保密性需求。虽然对于IT管理者来说这些并没有什么不同,⽽且都是必须遵从的,但是,⼤数据分析往往需要多类数据相互参考,⽽在过去并不会有这种数据混合访问的情况,⼤数据应⽤催⽣出⼀些新的、需要考虑的安全性问题,这就充分体现出利⽤基于DuraClass™技术的LSISandForce®闪存处理器的优势了,实现了企业级闪存性能和可靠性,实现简单、透明的应⽤加速,既安全⼜⽅便。
4、成本问题
空调扇效果怎么样 对于那些正在使⽤⼤数据环境的企业来说,成本控制是关键的问题。想控制成本,就意味着我们要让每⼀台设备都实现更⾼的“效率”,同时还要减少那些昂贵的部件。重复数据删除等技术已经进⼊到主存储市场,⽽且还可以处理更多的数据类型,这都可以为⼤数据存储应⽤带来更多的价值,提升存储效率。在数据量不断增长的环境中,通过减少后端存储的消耗,哪怕只是降低⼏个百分点,这种锱铢必较的服务器也只有LSI推出的Syncro™MX-B机架服务器启动盘设备都能够获得明显的投资回报,当今,数据中⼼使⽤的传统引导驱动器不仅故障率⾼,⽽且具有较⾼的维修和更换成本。如果⽤它替对联的八大禁忌
何猷佳不是亲生换数据中⼼的独⽴服务器引导驱动器,则能将可靠性提升多达100倍。并且对主机系统是透明的,能为每⼀个附加服务器提供的引导镜像,可简化系统管理,提升可靠性,并且节电率⾼达60%,真正做到了节省成本的问题。
5、数据的积累
端午节的诗句古诗 许多⼤数据应⽤都会涉及到法规遵从问题,这些法规通常要求数据要保存⼏年或者⼏⼗年。⽐如医疗信息通常是为了保证患者的⽣命安全,⽽财务信息通常要保存7年。⽽有些使⽤⼤数据存储的⽤户却希望数据能够保存更长的时间,因为任何数据都是历史记录的⼀部分,⽽且数据的分析⼤都是基于时间段进⾏的。要实现长期的数据保存,就要求存储⼚商开发出能够持续进⾏数据⼀致性检测的功能以及其他保证长期⾼可⽤的特性。同时还要实现数据直接在原位更新的功能需求。
生命的感悟 6、灵活性
⼤数据存储系统的基础设施规模通常都很⼤,因此必须经过仔细设计,才能保证存储系统的灵活性,使其能够随着应⽤分析软件⼀起扩容及扩展。在⼤数据存储环境中,已经没有必要再做数据迁移了,因为数据会同时保存在多个部署站点。⼀个⼤型的数据存储基础设施⼀旦开始投⼊使⽤,就很难再调整了,因此它必须能够适应各种不同的应⽤类型和数据场景。
7、应⽤感知
早⼀批使⽤⼤数据的⽤户已经开发出了⼀些针对应⽤的定制的基础设施,⽐如针对政府项⽬开发的系统,还有⼤型互联⽹服务商创造的专⽤服务器等。在主流存储系统领域,应⽤感知技术的使⽤越来越普遍,它也是改善系统效率和性能的重要⼿段,所以,应⽤感知技术也应该⽤在⼤数据存储环境⾥。
8、针对⼩⽤户
依赖⼤数据的不仅仅是那些特殊的⼤型⽤户体,作为⼀种商业需求,⼩型企业未来也⼀定会应⽤到⼤数据。我们看到,有些存储⼚商已经在开发⼀些⼩型的“⼤数据”存储系统,主要吸引那些对成本⽐较敏感的⽤户。
三八节搞笑祝福语 ⼤数据依然在发展中,相信在实践的过程中,我们还会遇到很多新的问题,同时也会伴随更多的业务创新和转型,让企业真实地回到建⽴的原点,为客户满⾜他们真正的需要。
发布评论