Raskere tilgang til data påvirker lagringssystemene
Å forstå konsekvensen av ny teknologi blir viktigere selv om teknologien er skjult. Programvaredefinert lagring vil påvirke arkiveringen, og lagringssystemer med bare flash er blitt veldig populære de seneste to årene. Entusiasmen for lagring er tilbake.
Mange kunder gir inntrykk at det er de samme utfordringene på lagring som tidligere. Men under overflaten forsøker fagfolk å forstå konsekvensene av programvaredefinerte lagringssystemer og lagringsteknologi i form av flash. Det er en dreining fra magnetisk til elektronisk lagring.
For teknologi får større oppmerksomhet hos administrerende direktører fordi virksomhetene i øyeblikket er i en veldig omstilling, transformasjon til hva man skal leve av de nærmeste årene.
IBM gjør årlig en studie hos toppledelsen i 70 land på de viktigste innsatsfaktorene som påvirker organisasjonen og strategiene. Mer enn 4.000 direktører svarer på IBMs spørsmål.
- I 2008 var teknologi på tredje plass, i 2010 rykket den opp på andre plass og siden 2011 har teknologi vært den viktigste eksterne faktoren, påpeker Nina Wilhelmsen, direktør for teknisk utstyr i IBM.
Fortsatt kostbart
Prisene for et lagringssystem varierer fra 50.000 til 50 millioner kroner. Riktignok er gateprisene lavere for de største systemene, men prisingen er avhengig av kundeprosjektet.
Dell og Nexsan er kjent for å kunne levere produkter med lave priser. I sommer leverte Atea et stort lagringssystem til Nasjonalbiblioteket basert på Nexsan. Amazon og Microsoft spiser allerede av det norske lagringsmarkedet. Det vil etter hvert andre internasjonale skyleverandører.
- 45 prosent av vår lagringskapasitet leveres nå som en tjeneste. For to år siden var ikke noe, sier Rune Sund, administrerende direktør i Hitachi Data Systems.
Lagring som en tjeneste vil bli normen for å sikre data, enten i egen sky eller fra en skyleverandør. Det er nærmest umulig å gjenopprette viktige data fra magnetbånd med de mange TB og PB kunder har anskaffet. Spesialisten Purity har lagring som en tjeneste fra sitt datasenter i Oslo.
- En entry modell Eternus DX60 med disk begynner på rundt 25.000 kroner, mens den største DX8900 med en edruelig lagringskapasitet kommer på 30 – 35 millioner kroner, sier Line Meland, lagringsansvarlig i Fujitsu.
Eternus er det egenutviklete lagringssystemet til Fujitsu som i syv ulike modeller håndterer lagringsutfordringene for de minste til de aller største kundene. Systemet er lite kjent i Norge, men skyleverandøren Intility har anskaffet flere mindre modeller.
I sommer ble det aller største systemet fornyet med eksempelvis 12 Gbit per sekund overføring til platelagrene.
- Det vi beviser nå er at vi håndterer latency, hevder Line Meland.
Latency, latens eller reaksjonsevne er en av de viktigste egenskapene i alle lagringssystemer.
Minimum leveres Eternus med et kabinett med fire kontrollenheter og åtte platelagre, maksimalt tolv kabinetter, 192 kontrollenheter og 4.608 platelagre, teoretisk 13,9 PB og fire millioner inn/ut-transaksjoner per sekund.
Nye leverandører
Nye lagringsleverandører utfordrer de velkjente. Av de nye er Pure Storage og Nimble Storage representert på det norske markedet via kompetansefirmaet Purity It. Tilsvarende er Nimble Storage også på markedet via Grønn It.
- Nimble Storage leverer hybrid lagring for virtuelle miljøer og databaser med en god kost per gigabyte, sier Paal Holmboe, salgsansvarlig i Purity It.
Lagringsspesialisten Purity ble dannet med bakgrunn i at fagfolkene ville jobbe med nyere lagringsteknologi som de hadde tiltro til at ville skape interesse i markedet. Grønn it og effektivisering av datarom var to stikkord.
Purity valgte lagring fra 3Par som siden Hewlett-Packard kjøpte, og som har blitt Hewlett-Packards stjerneprodukt på lagring. 3Par er ikke lenger enerådende, men har blitt utvidet med Pure Storage og Nimble.
- Vi tilbyr 3Par for alle typer behov, Pure Storage for datavarehus og kritiske oppgaver og Nimble for generelle behov til SMB. 100 TB 3Par kostet i 2009 rundt syv millioner kroner. Samme ytelse og kapasitet koster nå 0,5 millioner kroner, sier Kjell Rune Øyrås, medgründer og salgsdirektør i Purity It.
Sikring som en tjeneste, BaaS, er blitt stort hos Purity. En sikringsmaskin, Backup Server, plasseres hos kunden som sørger for overføring av alle data til datasenteret til Purity ved hjelp av Commvault Simpana. Utviklingen overvåkes kontinuerlig hos Purity.
En stor elektronikkjede har kjøpt tjenesten BaaS.
Programvare viktig
For både EMC og IBM er programvaredefinert viktig. For begge er hensikten å skjule de tekniske detaljene for kundene. Individuelle lagringssystemer får dermed mindre betydning. Det er de samme tekniske komponentene i de forskjellige systemene. Det er programvaren som definerer hvilken profil lagringssystemet får.I enkelte tilfeller blir lagringen en del av et integrert eller konvergert system.
- Vi ser en trend at 20 prosent av kundene spør etter integrerte løsninger, sier Eirik Pedersen, europeisk salgsdirektør i Proact It.
Som IBM ser det er det viktig å frigjøre data fra lagringsbeskrankninger og samkjøre forretningsprosesser og applikasjoner. Derfor har IBM introdusert Spectrum Storage Solutions hvor smidighet, kontroll og effektivitet er viktige stikkord. Spectrum Accelerate, Scale, Control, Protect, Virtualize og Archive er viktige funksjoner.
Grunnlaget for at IBM virkelig ønsker å markere seg er bedriftens forståelse for data, programvare og lagring, skyleveranser og infrastruktur. På infrastruktur er det IBM Storwize, XIV, DS8000, Flashsystem og magnetbåndsystemer som utgjør stammen. Disse kombineres med standardiserte datamaskiner.
- Spectrum Virtualize sørger for å ta tradisjonelle lagringsnett og gjøre dem om til et programvardefinerte nett med bedre kapasitet, sier Lars Norbryhn, teknologiarkitekt på IBM lagring.
Bruker åpen kode
EMC har i over ti år jobbet aktivt med lagringsprogramvare. Nytt er Recover Point som fra det største lagringssystemet VMAX sørger for datareduksjon via deduplisering til et Data Domain sikringsarkiv. Det benyttes mye åpen kildekode som grunnlag for arkiveringsprogramvaren.
Automatisering og virtualisering er to stikkord. Ved hjelp av en portal med virksomhetens lagringspolicy kan programvaren Viper sørge for tilgang til alle mulige lagringssystemer via programvaregrensesnitt.
- Viper blir mer interessant ved bruk av skylagring og flere og flere lagringssystemer fra forskjellige produsenter, hevder Kristian Heim, teknologidirektør i EMC.
Viper tyder kvalitetskravene til lagringen og velger riktig lagringssystem. Skylagring er bare programvare for dirigering til et lagringssystem et annet geografisk sted. Om det ønskes, sendes det en melding om godkjenning av lagringskvaliteten til en overordnet.
- Vi har ingen tro på at det er ett produkt som løser alle problemer i fremtiden. Derfor opprettholder vi en portefølje produkter, sier Jørn Malsten, teknologirådgiver i EMC.
Tilsvarende alternativer tilbyr lagringsspesialisten Proact som leverer lagringssystemer fra tre velkjente lagringsleverandører. Netapp, EMC og Hitachi Data Systems. Det er mange forskjellige lagringsprodukter.
- I Norge er kundene veldig tradisjonelle. I EU er også markedet tradisjonelt, hevder Tom Evert Olsen, senior infrastrukturarkitekt i Proact It.
Like fullt må Proact innrømme at andre typer lagringssystemer har fått innpass de seneste årene. For to år siden hadde de færreste kundene hørt om lagringsteknologien flash. Nå er mange nysgjerrige.
- Det er forskjell i pris om det skrives mindre enn en gang i døgnet i forhold til 25 ganger i døgnet, påpeker Tom Evert Olsen.
Forståelse for lagringsbehov er derfor viktig ved mulig bruk av flash-lagring.
Teknologibegreper endres
Mens lagringssystemer tidligere benyttet design for å poengtere produktet, vil systemene fremover bruke standard kabinetter. Hva slags type lagringssystem vil det ikke være mulig å avgjøre ved å se på kabinettet.
Begreper som blokk, fil og objekt vil miste noe av sin betydning som det brukes i dag. Blokk vil få større betydning ved at data lagres og leses i blokker. Lagringsnett vil miste noe av sin betydning. Alle lagringssystemene vil være nettverkstilkoblet, noen eksternt tilkoblet andre via virtuelle lagringsnett.
Inn/ut-transaksjoner per sekund blir det viktigere å forstå. Det er avgjørende for valg av lagringsteknologi.
- Vi får forespørsel på typisk 300.000 transaksjoner per sekund mens kundene har rundt 20.000 transaksjoner. Det krever kompetanse å dimensjonere riktig fremholder Tom Evert Olsen.
Databaser og bruk av tynne klienter (VDI, Virtual Desktop Infrastructure) har store krav til mange transaksjoner per sekund. Reaksjonstid (latens) og hastighet på nettet vil ha betydning. Hvordan dataene spres over alle lagringsenhetene vil ha stor betydning. Sikring av data ved hjelp av RAID (Redundant Array of Independant Disks) vil få mindre betydning. Mange kopier av viktige data får stor betydning.
Elektronisk lagring
Siden 1956 har permanent lagring blitt dominert av roterende platelagre i kombinasjon med magnetbånd. IBM startet utviklingen og er fortsatt en dominerende lagringsaktør, først og fremst hos etablerte kunder.
Om magnetisk lagring fortsatt vil dominere om fem år er usikkert. Permanent elektronisk lagring får stadig større betydning. Nettbrett og smarttelefoner lagrer alt elektronisk. Pc-er vil mer og mer lagre elektronisk. Det er raskere, tar mindre plass og reduserer vekten, men øker prisen.
Flash er en permanent minneteknologi basert på elektronisk lagring. Navnet kommer av at en kollega av oppfinneren i Toshiba følte at fjerning av data føltes som å bruke en flash på et fotoapparat. Siden har denne lagringsteknologien vært betegnet flash.
I praksis er Flash en videreføring av batteristøttet minne, (EEPROM, Electricaly Erasable Programable Read Only Memory), som de største datamaskinene benyttet for 30 år siden. De var uhyggelig kostbare og ble derfor bare benyttet for små datamengder. Analyseselskapet Gartner kaller flash for SS, (Solid State) som angir at innholdet ikke endres.
De senere årene har flash blitt brukt for forbrukerformål i minnepinner og telefoner og for lagringsformål for virksomheter. Kvalitetskravene for lagring av bedriftsdata har medført at lagringssystemer basert på flash helt frem til i år har vært kostbare.
Utviklingen fortsetter. Krymping av teknologien har stoppet opp. Under 15 nanometer produksjonsteknologi er utfordrne. Nå er det lagring vertikalt ved hjelp av tre bit Multi Level Cell, MLC. Flere snakker om 48 lag tredimensjonale brikker.
Samsung har satt rekord med en lagringsenhet på 15,36 TB, men når den kommer og hva slags bruksbehov den skal benyttes til, er usikkert. For lagringssystemer er det typisk 1,9 TB som benyttes. 3,2 og 6,4 TB lagringsenheter er på vei.
Prisfall
De to seneste årene har det vært en betydelig prisreduksjon. Men ved å kombinere flash med datareduksjon blir prisen på samme nivå som tradisjonelle platelagersystemer.
- For to år siden var flash fryktelig dyrt. Nå er det bare dyrt, påpeker Tom Evert Olsen.
Det Tom Evert henviser til er lagringssystemer som bare benytter flash, ikke systemer som benytter flash for den raskeste lagringen i tillegg til platelagre. Siden flash benyttes i lagringssystemer har lagringsenhetene blitt tilpasset kravene til platelagre.
Flash simulerer dermed det roterende platelageret og har dermed fått betegnelsens SSD, Solid State Disk. Fordelen er at det kan erstatte platelagre direkte, ulempen er at hastigheten reduseres ved programvare som later som det er en roterende enhet med typisk 6 Gbit per sekund tilkobling.
- Det er tre typer lagringssystemer med flash, sier Rune Sund, administrerende direktør i Hitachi Data Systems.
De fleste lagringssystemer med Flash benytter flash på øverste lagringsnivå, deretter benyttes plater med 10.000 omdreininger på inntil 1,2 TB, etterfulgt av langsommere kapasitetsplater med 7.200 omdreininger på 6 TB.
De to andre typene lagringssystemer benytter bare flash, ett med to typer flashlagring for best pris/ytelse og det andre som blir bygget med flash for å tilfredsstille et spesialbehov.
Fordelingen av lagringsenheter i generelle lagringssystemer har vært rundt 60 prosent på kapasitetsplater, 35 prosent på raske plater og resten på flash. Men fordelingen varierer.
Hvor stor andel flash som bør benyttes må analyseres før anskaffelse basert på logger over tilgangen til platelagrene. Ofte kan det være få platelagre som jobber mest.
- Vi henter data fra logger over hvor mange prosent av I/O som går til hvor mange prosent av diskene, forklarer Kristian Heim.
Avhengig av skjevfordelingen av databelastningen foreslår EMC å variere flash-bruken i lagringssystemet fra to til 40 prosent.
Betydelig vekst
- Vi ser en veldig trend til å gå over til flash. I 2015 vil halvparten av omsetningen på lagring være flash, understreker Kjell Rune Øyrås.
- Totalt har vi skipet 100 PB med flash i verden i fjor. Veksten på ren flash-lagring er på nesten 60 prosent ut 2016, hevder Rune Sund.
Hitachi Data Systems, HDS, måler utnyttelsen av Flash-bruken.
- For et år siden brukt kundene typisk bare to prosent flash. Nå har det økt til nærmere ti prosent. Tidligere utnyttet kundene bare Flashen 25 prosent. Nå er vi oppe i 50 prosent, fremhever Claus Andresen, teknologidirektør i HDS.
Flash har store forskjeller i les og skrivehastighet. Lesehastigheten kan være mellom fem og ti ganger raskere enn skrivehastigheten. Og det er skrivingen som er kritisk, både hastighet og evnen til å overskride samme lagringscelle om igjen og om igjen.Cellene blir langsomt slitt ut, så det benyttes regler for hvor dataene skal plasseres.
Tidligere ble det snakket om utslitningsnivå, Wear Level, men i dag er lagringsbrikkene så robuste at de garanteres i fem til syv år. Hvor mye ekstra kapasitet som må benyttes, snakkes det ikke om.
Lagringssystemer med bare flash har fått betegnelsen AFA, All Flash Array. I slike tilfeller er det ikke nødvendig å benytte SSD. Lagringsbrikkene kan adresseres direkte. Det gir raskere tilgang for spesialoppgaver. De fleste vil nok simulere platelager for å gjøre lagringen teknologinøytral.
HDS har utviklet en egen styringsbrikke for optimalisering av bruken av flash basert på en Arm-prosessor med fire kjerner, grensesnitt mot PCIe, minne og flashbrikkene. Disse er på 1,6 TB, 3,2 TB og 6,4 TB. Hensikten er å kunne foreta parallelle les og skriv.
Bare flash
Det er lagringssystemer med bare flash som er hett. Analyseselskapet Gartner har vurdert lagringssystemene og anser EMC og Pure Storage som de ledende tett fulgt av IBM og HP.
EMC hevder å være best med Extreme IO som er bygget som et flasharkiv med deduplisering. 25 lagringsenheter inngår i en hylle styrt av to styringsmaskiner. Totalt åtte slike lagringsmoduler utgjør Extreme IO. Kapasiteten på lagringsenhetene er 5, 10, 20, 40 TB. Prisen er en million kroner per lagringsmodul.
- Vi har solgt nærmere 4 PB med Flash i år, sier Arild Saghagen Senior produktansvarlig på lagring i Hewlett-Packard, HP.
Det er en dramatisk utvikling siden andre halvår 2012 hvor det ble solgt noen få TB. I første kvartal 2013 solgte HP 10 TB, i første kvartal 2014 149 TB og i første kvartal 2015 1.158 TB. Kvartalene refererer til HPs finanskalender hvor året starter første november.
- Vi har en generell lagringsserie, 3Par Storeserv. Vi tilbyr enklere lagringssystemer når pris er viktig, flashsystemet 7450c når ytelse er viktigst, og de store lagringssystemene når skalerbarhet er viktigst, forklarer Arild Saghagen.
Det seneste året har det vært en rekke forbedringer til 3Par. I Juni kom nye toppmodeller 20800 og 20850 og en flashenhet på 3,84 TB. 20850 kan leveres som et fullstendig flash system med en kapasitet på 3,9 PB før komprimering.
Prisutviklingen har vært enorm, en reduksjon fra rundt 80 kroner per GB for flash i 2013 til rundt 15 kroner per GB nå, som er halvparten av prisen i 2014. Med komprimering blir det rimeligere enn for tilsvarende lagringssystem med platelagre.
- Vi solgte det første lagringssystemet med bare flash i april 2014. Hittil i år er det solgt 51, forklarer Arild Saghagen.
- Det er flash-systemer kundene spør om. Flash-systemet er på 2 U, disk-systemet er på 8 U. Flash benytter 400 W, disksystemet 1,5 KW, sier Tor Inge Lillebø, teknologirådgiver på lagring i HP.
Sammenligningen er ikke helt rettferdig for dataene i flashsystemet er komprimert mens de ikke er det i 3Par 7400 for å oppnå 73 TB lagrete data.
Mikrosekunder
Flashsystemet V9000 som er en videreutvikling av flash-teknologien til Texas Memory Systems som IBM kjøpte opp, er helt nytt. Kostnadene for flash lagringsenheter er ifølge IBM lavere en de raskeste platelagrene. Det skyldes evnen til komprimering. IBMs erfaring tilsier at komprimeringen er på 65 prosent.V9000 har en utvidelsesmulighet til 2,2 PB. IBMs pre er at lagringsenhetene ikke simulerer platelagre, men benytter egen adressering som gir en reaksjonstid på 100 mikrosekunder.
- Vi er overlegne på flashteknologi. Nå kjører vi Proof of Concept sammen med partnerne på våre Flash System. De fleste kundene som får prøve flash, vil ikke gi fra seg boksen før de har fått sin egen, understreker Nina Wilhelmsen.
I årene som kommer vil det bli jobbet med lagringssystemer med flash som adresseres på en annen måte. Lagringen i datamaskinens minne vil passe bedre sammen med lagringen på flash. Tilkobling vil sannsynligvis være ved hjelp av PCI-express.
Hvor store lagringsobjektene vil være er usikkert, men lagringsobjekter på 4 KB, tilsvarende den klassiske størrelsen på sider i datamaskinens minne er ikke utenkbart. En av grunnene er at det vil bli foretatt deduplisering ved å fjerne like kopier av data før de skrives på flash.
EMC har kjøpt firmaet DSSD som har laget et oppsett for enda raskere bruk av Flash-teknologi. Selskapet ble grunnlagt av fagfolk fra tidligere Sun med Andy Bechtolsheim i spissen. Hvordan teknologien virker, er ennå usikkert, men målet er å ta seg av spesielt kritisk databehandling.