Come consolidare 1000 server in 20 server con NetApp

Scritto il 22/07/2010
 

Caso di successo NetApp realizzato da NetApp Bangalore (India)

Tutto inizia al NetApp Engineering Lab di Bangalore, in India. Il nostro obiettivo è soddisfare le richieste di progettazione e archiviazione dei circa 700 ingegneri sviluppatori che lavorano su una vasta gamma di aspetti NetApp, tra cui WAFL, NAS e SAN, gestione dello storage, VTL, sistemi aperti SnapVault (OSSV) e SnapDrive per UNIX.

Nell’agosto 2008, con in azienda circa 1.000 server x86 posizionati per soddisfare le diverse esigenze dei numerosi progetti di ingegneria, ci siamo accorti che la domanda continuava a crescere a un ritmo di circa 40 server mensili (circa 2 rack di server ogni mese).

Una così crescente richiesta ci creava problemi sia nella disponibilità di rack, sia nei consumi elettrici e, non da ultimo, nel raffreddamento. La situazione rischiava ulteriormente di complicarsi a causa della lentezza e della scarsa flessibilità nell’inizializzazione dei server fisici, rendendoci problematico soddisfare le richieste dei team.

Il progetto COLD (Consolidamento e Ottimizzazione del Lab/Datacenter) è stato intrapreso con l’obiettivo di consolidare e virtualizzare le risorse critiche. Attualmente siamo nel mezzo di questa transizione. A fine progetto ci aspettiamo di sostituire almeno il 50% dei 1.000 server fisici con 20 server VMware ESX. Abbiamo deciso di conservare un numero limitato di server fisici, ancora in definizione, da utilizzare per testare le applicazioni che richiedono un hardware fisico.

I server VMware dovranno accogliere anche i futuri ampliamenti e migliorare notevolmente la capacità di adattarci alle necessità sempre nuove degli ingegneri.

Consolidamento e virtualizzazione

Consolidamento di server e storage sono i cardini di questo progetto, le nostre parole chiave per ridurre i costi e incrementare l’efficienza. La virtualizzazione massimizza il valore, sia in termini di capitale investito che di costi operativi, mentre la tecnologia storage attraverso una maggiore automazione e scalabilità offre funzionalità multiple o servizi da una piattaforma singola.

Il nuovo centro dati utilizza le tecnologie più versatili per rispondere alle richieste degli ingegneri e soddisfare le esigenze operative dell’azienda, anche durante i picchi di lavoro. La virtualizzazione aggiunge valore al data center incrementando flessibilità, scalabilità, facilità di gestione, e reattività.

Con la virtualizzazione i centri IT massimizzano l’utilizzo delle risorse esistenti, per una gestione efficiente delle infrastrutture anche quando sono sottoposte ad elevati indici di crescita. Abbiamo valutato diverse soluzioni di virtualizzazione prima di optare per VMware in sinergia con lo storage NetApp. La nostra scelta è caduta su VMware per la vasta gamma di sistemi operativi che supporta, che è il prerequisito base per questo progetto.

Le sfide iniziali

All’inizio, abbiamo dovuto affrontare una serie di sfide organizzative e tecniche.

Budget ristretto

Poiché il nostro budget era limitato, questo progetto di virtualizzazione è iniziato con attrezzatura minima. Il progetto è stato avviato con due server presi in prestito (che hanno già a bordo VMware ESX), più uno storage NetApp FAS3050. Il materiale sufficiente per fare una prova concettuale. A questi server è stata aggiuntiva della memoria per poter gestire più macchine virtuali.

Ansie da ingegneri

Gli ingegneri erano scettici: non credevano che una macchina virtuale fosse in grado di coordinare il carico che gli stessi server fisici erano abituati a gestire. Questa preoccupazione era ulteriormente complicata dal fatto che le esigenze di ciascun progetto di ingegneria erano considerabili come uniche. Tuttavia, utilizzando inizialmente anche solo due server siamo riusciti a convincerli a sufficienza a portare avanti questa strada.

Integrazione della rete

Il nuovo ostacolo era comprendere come integrare una server farm virtuale all’ambiente fisico. Le alternative erano: fornire un singolo server ESX a ogni VLAN o modificare la topologia della rete. Nel primo caso le risorse non sarebbero state utilizzate completamente, e ci saremmo trovati ad avere bisogno di un numero maggiore di licenze di ESX, con una gestione più complessa. Tuttavia, la seconda opzione risultava più complicata e avrebbe richiesto considerevoli tempi morti per la realizzazione.

Dopo accese discussioni con i partner e il servizio di assistenza ingegneristica, abbiamo optato per una server farm virtuale in grado di ospitare tutti i nostri server ESX, i sistemi di storage, networking e tutti gli equipaggiamenti, con collegamenti a ciascuna VLAN.

Server Farm virtuale: configurazione e provisioning

L’infrastruttura virtuale è ora cresciuta in una farm composta da 8 server e da 1 cluster NetApp FAS3050, che ospita 436 macchine virtuali per supportare ben 17 equipe di ingegneria. Abbiamo portato a termine finora 150 conversioni da fisico a virtuale (P2V), utilizzando per alcuni progetti VMware GSX.

Le risorse comuni sono configurate su VMware Virtual Center e sono raggruppate e gestite per gruppi di macchine virtuali. La connettività di rete è  fornita da due porte di rete da 1 GB, combinate per il bilanciamento del carico e della ridondanza.

Il FAS3050 in cluster è dotato di quattro dischi da 300 GB FC e multipli per il failover di storage. Le porte di rete del sistema di storage sono configurate come NetApp VIFs per la ridondanza e bilanciamento del carico.

Tutti gli archivi di dati ESX sono ospitati da questo sistema di archiviazione che utilizza NFS. Abbiamo optato per NFS perché era economicamente conveniente, facile da configurare e da gestire. Il Fibre Channel datastore avrebbe richiesto dell’hardware aggiuntivo come FC switch, HBA e sistemi di cablaggio, che non potevamo acquistare per i vincoli di bilancio imposti. Inoltre, le prestazioni utilizzando NFS datastore erano comparabili a quelle di FC.

Le nuove macchine virtuali vengono fornite con NetApp rapid cloning utility version 1. Questo processo sfrutta NetApp FlexClone in modo tale che macchine virtuali similari possono condividere lo stesso storage, senza sprecare spazio storage per copie ridondanti degli stessi file del sistema.

Migrazione da server fisico a virtuale

Il team di ingegneri ci ha espressamente richiesto che le configurazioni server esistenti rimangano invariate. La sfida è stata mantenere host, indirizzi IP e configurazioni del sistema operativo server nel passaggio da fisico a virtuale.

Per realizzare queste migrazioni, prima, ed estendere poi la rete dati da ogni team alla server farm virtuale, abbiamo utilizzato VMware Virtual Center. La maggior parte delle migrazioni sono coincise con i fine settimana o i giorni festivi, per ridurre i tempi di inattività degli operatori. Le nuove macchine virtuali sono poi state monitorate regolarmente per verificare le performance.

Stato della transizione

La curva di incremento delle macchine virtuali e dei server fisici disattivati viene controllata periodicamente e tracciata in formato grafico. Il nuovo obiettivo è di ridurre il numero di server fisici a 500 entro i prossimi 6-9 mesi. Allo stesso modo nello stesso arco temporale il numero delle macchine virtuali è destinato a crescere fino a 1.500.

Ci aspettiamo di ospitare tutte e 1.500 le macchine virtuali con soli 20 server VMware ESX. I nostri attuali 8 server supportano 450 macchine virtuali con una CPU di media grandezza e l’utilizzo della memoria si aggira intorno al 30%, lasciando disponibile molto spazio per supportare altre macchine virtuali.

Sviluppi futuri

Siamo molto soddisfatti dei nostri progressi e possiamo già intravedere ulteriori opportunità di sviluppo rese possibili dall’ambiente virtuale creato:

  • Supporto multipiattaforma: l’ambiente attuale comprende solo i server basati su processori Intel. Ci piacerebbe supportare anche piattaforme PowerPC e l’ambiente operativo AIX IBM usando partizioni logiche (LPAR) e SPARC con Solaris Containers.
  • Una singola dashboard di gestione: l’ambiente di gestione si basa su un Virtual Center per monitorare e gestire i server VMware e le macchine virtuali, più NetApp Operations Manager per monitorare e gestire lo storage. Al momento stiamo esplorando l’uso di NetApp SANscreen per vedere server e storage in un’unica dashboard.
  • Business continuity: il recupero dei dati in un ambiente server fisico è solitamente difficile, ma il nuovo ambiente virtuale eleva considerevolmente il livello di continuità operativa. Ci piacerebbe utilizzare SnapMirror per “specchiare” tutti i dati delle macchine virtuali in un unico sistema NetApp NearStore. Questo ci darebbe la possibilità di recuperare rapidamente da qualsiasi server o guasto nell’hardware di archiviazione.
  • Server e storage on demand: il nostro sogno è di creare un ambiente self-service, in cui i tecnici possano richiedere risorse server e storage online e quelle risorse vengano rese immediatamente disponibili grazie al provisioning, senza il coinvolgimento dell’amministratore.

Conclusioni

Anche se il nostro intervento non è ancora giunto al termine, stiamo già assistendo a notevoli benefici dall’ambiente virtuale:

  • Provisioning più rapido: se un progetto di ingegneria necessita di un paio di server aggiuntivi per eseguire alcuni test, ora possiamo disporre nuovi server virtuali in pochi minuti.
  • Bilanciamento del carico: se un server fisico va in sovraccarico, un monitoraggio periodico delle macchine virtuali previene i problemi di prestazioni, con la possibilità di aggiungere rapidamente le risorse necessarie tramite gli strumenti VMware.
  • Migliore capacità di recupero: ora possiamo recuperare più rapidamente dagli errori del server o del sistema operativo. Se un server virtuale si blocca, in poco tempo riusciamo a ridistribuire il carico sui server virtuali restanti.
  • Diminuzione tempi di inattività: l’adozione di VMware e dello storage NetApp rende possibile la manutenzione senza tempi di inattività, riducendo l’impatto sull’operatività degli ingegneri.
Serverlab