Verwendung von Exagrid Deduplication Appliances als Veeam Repository
Die Bedeutung von Backup und Recovery Lösugen stehen heute außerhalb jeder Diskussion. War es vor etwa 10 Jahren noch ein gerne vernachlässigtes Thema, kann sich heute kein Unternehmen mehr Datenverlust oder Ausfall von Service-Verfügbarkeit leisten. Damit rückten Backup-Lösungen in Bezug auf Wichtigkeit auf Augenhöhe mit den eigentlichen Produktivsystemen. Die Zeitfenster für RPO und RTO werden folglich immer kleiner und der hierfür notwendige Aufwand und damit die Kosten immer höher. Wer ein Backupkonzept plant muss eine Balance finden zwischen Geschwindigkeit, Zuverlässigkeit und Kosten. Low-Cost NAS Boxen sind nicht sehr zuverlässig und langsam – vor allem wenn man davon ein Instant Recovery fahren muss. Premium Storages sind schnell und verlässlich, aber auch sehr teuer. Die darauf abgelegten Backupdaten sind unter Umständen hochredundant, sodaß hier ein hohes Einsparpotenzial in Deduplizierung liegt.
Deduplication
Deduplizierung läßt sich auf zwei Arten realisieren: Hardware und Software. Backup Lösungen wie z.B. Veeam bieten Software Deduplizierung. Hierbei erfolgt die Deduplizierung im Datenstrom, noch bevor die Daten auf dem Plattenspeicher landen.
Ein alternativer Ansatz sind Dedup-Appliances, bei denben der Datenstrom zunächst auf dem Plattenspeicher landet und dann nachgeschaltet eine Deduplizierung stattfindet. Diese erreicht in der Regel höhere Deduplizierungsraten als inline Deduplizierung, da die Algorithem der Appliance den gesamten Datensatz vergleichen können und nicht nur einen Ausschnitt des Datenstroms.
Exagrid
Ich möchte hier beispielhaft Deduplication Appliances der Firma Exagrid vorstellen. Diese Geräte haben im Vergleich zu anderen Herstellen einige Besonderheiten – insbesondere in Verbindung mit Veeam Backup.
Landing Zone
Alle Backupdaten werden zunächst in einer so genannten Landing-Zone abgelegt. Lese- und Schreibzugriffe dorthin sind schnell. Füllt sich die Landing-Zone, so beginnt die Appliance im Hintergrund mit der Deduplizierung und Kompression der Daten, die dann im Archivspeicher abgelegt werden. Die neuesten Backupdaten werden in rohform innerhalb der Landing-Zone gehalten und sind somit sehr schnell verfügbar. Denn erfahrungsgemäß werden Restores in den allermeisten Fällen vom neuesten Datensatz gefahren. Andere Dedup-Lösungen müssen die Daten vor dem Restore zunächst “rehydrieren”, was rechenlastig und damit zeitintensiv ist.
Veeam Data Mover
Exagrid Appliances haben eine sehr tiefe Veeam-Integration. Der Veeam Backup Service spricht direkt mit einem Veeam Datamover (Veeam2Veeam), der sich auf der Appliance befindet. Damit können Daten schnell zur Appliance übertragen und auch wieder zurück geholt werden. Durch den integrierten Veeam Data Mover können Synthetic Full Backups mit hoher Geschwindigkeit auf der Appliance selbst erzeugt werden. Lösungen ohne Data-Mover müssen zunächst über CIFS das letzte Full-Backup und Inkremente in den Veeam Proxy einlesen und dann ein synthetisches Full Backup (zurück über CIFS) auf die Appliance schreiben. Durch den integrierten Data Mover entfällt dieser zeitintensive Prozess und die Erzeugung des Synthetic Full kann bis zu 6x schneller erfolgen.
Sicherheits Aspekte
Einen Veeam Datamover innerhalb der Appliance zu haben, bietet einen erheblichen Vorteil in der Verteidigung gegen Ransomware und Cryptolocker. Das Repository reicht keine CIFS/NFS shares nach außen. Die einzige Zugriffsmöglichkeit besteht innerhalb der Veeam Software (Veeam-to-Veeam). Und nur Veeam kennt die Zugangsdaten zum Repository. Selbst wenn eine Malware das ADS kompromittieren sollte und Zugriff auf ein administratives Konto erlangt, wird sie keinen Zugriff auf das Repository in der Appliance bekommen. Somit ist hier ein sogenanntes Airgap eingebaut, das das Repository vom restlichen Netz abschirmt. Verwendet man vergleichsweise einen Server mit lokalen Disks, so muss man dem Veeam Server eine Volume über CIFS oder als iSCSI Target präsentieren. Egal wie, wenn etwas administrative Rechte erlangt wird es Zugang zum Repository haben und kann die dortigen Backupdaten verschlüsseln.
Scale-out Grid
Mit zunehmendem Backup Datenvolumen erhöht sich der Platzbedarf auf der Appliance. Exagrid entgegent diesem mit dem Scale-Out Grid. Dabei werden einer bestehenden Appliance weitere Appliances hinzugefügt. Diese bilden einen Verbund, das sogenannte Grid. Dabei wird nicht nur die Speicherkapazität erhöht, sondern immer auch die Rechenleistung, RAM und Bandbreite.
Unterschiedliche Modellreihen lassen sich im Grid kombinieren. Die Folge sind nahezu konstante Backupfenster, auch bei deutlichem Anstieg des Backupvolumens.
Leistung
Wir haben uns bemüht, die Exagrid Appliance unter Stress zu setzen (mit wenig Erfolg). Wir verwendeten die Appliance als Primärziel für 29 VMs mit einem Datenvolumen von 4,1 TB. Es handelt sich dabei um VMs mit echten Arbeitslasten (Mail, Fileserver, Sharepoint, Terminalserver, Owncloud, Entwicklungsserver, DC)
Die Anbindung der Exagrid erfolgte über 10 GBit LAN. Zum Vergleich ein Repository mit lokalen NLSAS Disks (RAID5) und einem ReFS Filesystem. Werte sind gemittelt über >100 Backups.
Job | Target | Schedule | MB/s | Time [min] |
---|---|---|---|---|
Incremental | Exagrid | hourly | 200-300 | 10 |
Synthetic Full | Exagrid | daily | 200 | 90-120 |
Incremental | DAS, ReFS | daily | 50-90 | 120-160 |
Das initiale Active-Full zur Exagrid (4,1 TB) lief mit 460 MB/s. Alle weiteren Inkremente mit ca. 200-300 MB/s. Bottleneck war gundsätzlich Source.
Deduplication Ratio
Bei 120 Restore Points erreichten wir ein Verhältnis von 8:1 bis 10:1. Dieses wurde mit zunehmender Anzahl Backup besser.