DEBATT: 

VARMERE: Generativ AI trenger mer energikrevende maskinvare. Derfor øker etterspørselen etter nye måter å håndtere varmen fra grafikkprosessorene (GPUene) på. (Foto: Istock)

GenAI stiller nye krav til datasentrene

Kraftig AI-vekst betyr kraftig økning i energiforbruket, og tvinger frem nye ideer og ny teknologi i datasentrene. Overgang fra luft til væskekjøling er et godt eksempel.

Publisert

Datasentre står for en betydelig og stadig økende andel av det globale elektrisitetsforbruket. Og i DNVs ferske rapport, «Energy Transition Outlook Norway», nevnes datasentre som en av hovedgrunnene til at elektrisitetsbehovet i Norge vil øke kraftig de neste tiårene. En årsak til dette er det pågående racet med utvikling, implementering og bruk av generativ AI. 

Energinivåene som kreves for å drive dette fordobles ifølge en forskningsartikkel hver 100. dag. Eksempelvis bruker hver forespørsel til ChatGPT nesten yi ganger så mye energi som et Google-søk, ifølge estimater fra Goldman Sachs.

Nye ideer

Det økende energibehovet tvinger frem nye ideer og ny teknologi rundt energibruk i datasentrene, ikke minst innenfor nedkjøling. Generativ AI trenger nemlig mer energikrevende maskinvare, og etterspørselen etter nye måter å håndtere varmen fra grafikkprosessorene (GPUene) på øker.

Mike Creutzer, GM Nordics, ISG i Lenovo

GPUer som driver AI-plattformer krever fem til ti ganger mer energi enn sentralprosessorer (CPUer), på grunn av et større antall transistorer. Samtidig gjør nye, kostnadseffektive designmetoder med 3D-silisiumstabling det mulig for GPU-produsenter å pakke flere komponenter vertikalt, med mindre fotavtrykk. Dette fører igjen til at datasentrene trenger mer energi og skaper mer varme.

En annen relevant trend er et jevnt fall i såkalt TCase i nyere brikker. TCase er den maksimale sikre temperaturen for overflaten av brikker som GPUer. Det er en grense satt av produsenten som blant annet skal sikre at brikkene kjører jevnt og ikke overopphetes. På nyere brikker kommer TCase ned fra 90-100 grader Celsius til 70 eller 80 grader, eller enda lavere. Dette forsterker også behovet for mer effektiv kjøling.

Det økende energibehovet tvinger frem nye ideer og ny teknologi rundt energibruk i datasentrene, ikke minst innenfor nedkjøling.

Strekker ikke til

Kombinasjonen av ytelse og tetthet i komponentene i datasentrene gjør at tradisjonell luftkjøling ikke lenger strekker til. Med mindre serverne blir tre ganger større enn tidligere, må varme fjernes mer effektivt. Vannkjølte systemer kan redusere strømforbruket med 40 prosent sammenliknet med tradisjonell luftkjøling, og er en enkel måte å redusere CO2-utslipp på. I tillegg til bærekrafts- og kostnadsfordeler, støtter denne tilnærmingen den videre AI-utviklingen.

Væskekjøling blir derfor mer utbredt, og offentlige forskningsinstitusjoner var tidlig ute. De etterspør ofte den nyeste og beste datasenterteknologien for å drive høyytelses databehandling (HPC) og AI, og har en tendens til å bekymre seg mindre om risiko ved bruk av ny teknologi før den er etablert i markedet.

Private virksomheter er gjerne mer risikoaverse, og vil ofte være sikre på at ny teknologi vil gi avkastning før de implementerer den. Vi ser imidlertid nå at stadig flere virksomheter, blant annet innen finans – som ofte er konservative – tar i bruk teknologien. Det samme gjelder bilindustrien, som er store brukere av HPC-systemer, og tjenesteleverandører i såkalte colocation datasentre.

Enormt energibehov

Generativ AI har et enormt energibehov som de færreste virksomheter kan tilfredsstille innenfor egne lokasjoner. Mange går derfor til et colocation datasenter og tjenesteleverandører som kan levere de nødvendige ressursene. Disse går nå over til ny GPU-arkitektur, og kan oppnå mange fordeler ved å implementere væskekjøling.

Generativ AI har et enormt energibehov som de færreste virksomheter kan tilfredsstille innenfor egne lokasjoner.

Vi har gjennom flere år erfart at væskekjølingssystemer med bruk av rent vann og inntak ved romtemperatur, gjør at man unngår kostnader for kjølere og reduserer energiforbruk, både for individuelle servere og servere i større datasentre. Men dette er på enhetsnivå. Omkretskjøling, fjerning av varme fra datasenteret – krever mer energi. Det kan bety at bare to tredjedeler av energien datasenteret bruker går til databehandling, som senteret er designet for – mens resten brukes til nedkjøling.

Liten mengde energi

Power Usage Efficiency (PUE) er et mål på energieffektiviteten i datasentre. Den regnes ut ved å ta strømforbruket i hele datasenteret, inkludert for kjølesystemene, delt på strømbehovet til it-utstyret. Noen av sentrene som er optimalisert med væskekjøling oppnår en PUE på 1,1, og noen til og med 1,04, noe som er en svært liten mengde marginal energi. I tillegg kommer muligheter for å gjenbruke den varme væsken eller vannet, for eksempel til oppvarming av bygningen.

Energibehovet knyttet til generativ AI vil bare øke, og væskekjølte systemer bidrar til å oppnå den energitettheten som kreves.

Tetthet er også svært viktig. Væskekjøling gjør det mulig å pakke mye utstyr med høy rack-tetthet. Med væskekjøling kan vi fylle disse rackene slik at datasenteret krever mindre eiendomsareal.

Energibehovet knyttet til generativ AI vil bare øke, og væskekjølte systemer bidrar til å oppnå den energitettheten som kreves. Det gir virksomheter mulighet til å redusere forbruket, samtidig som datasentre kan imøtekomme krav om antall GPUer for å drive morgendagens innovasjon.