vCenter Statistiken fluten Datenbank

Wer hat die Datenbank geflutet?

Ein inzwischen gewohntes Bild bei vCenter Installationen auf Windows Basis mit der integrierten SQL Express Datenbank: der vCenter Dienst ist angehalten. Nach manuellem Start läuft dieser einige Sekunden und stoppt dann wieder. Ein Blick in die Ereignisprotokolle liefert Event ID 1105 und 1827.

Event 1105:

Could not allocate space for object ‚dbo.VPX_HIST_STAT1_222‘.’PK_VPX_HIST_STAT1_222′ in database ‚VIM_VCDB‘ because the ‚PRIMARY‘ filegroup is full. Create disk space by deleting unneeded files, dropping objects in the filegroup, adding additional files to the filegroup, or setting autogrowth on for existing files in the filegroup.

Event 1827:

CREATE DATABASE or ALTER DATABASE failed because the resulting cumulative database size would exceed your licensed limit of 10240 MB per database.

Die Meldung erklärt den Grund der Störung. Das Größenlimit der Datenbank wurde erreicht. Im beschriebenen Fall wurde die Datenbank zuvor bereits von einer SQL-Express 2005 (max. 4GB) auf eine SQL-Express 2008 R2 (max. 10GB) migriert. Dennoch wurde das Limit erreicht.

VCHistStat02Der Cluster aus 4 Hosts sollte damit zurecht kommen und die Haltezeiten der Ereignisse wurden bereits auf 21 Tage limitiert. Welche Tabellen sind also für den Anstieg des Datenaufkommens verantwortlich? Unter SQL Server Express 2008 R2 haben wir hier mehrere Möglichkeiten zur Analyse.

Report Tools

Einen sehr schnellen und komfortablen Überblick liefern die eingebauten Report Tools. Dazu verbindet man das Mangement Studio Express mit der Datenbank Instanz auf vCenter und markiert die vCenter Datenbank (VIM_VCDB). Über das Kontextmenü [Reports > Standard Reports > Disk Usage by Top Tables] erhält man einen Bericht der größten Tabellen.

T-SQL Skript

Ältere Versionen von SQL-Express verfügen unter Umständen nicht über die Report Funktionen. Hierfür muss man sich mit einem Skript behelfen, das z.B. bei Stackoverflow publiziert wurde.

SELECT 
 t.NAME AS TableName,
 i.name as indexName,
 sum(p.rows) as RowCounts,
 sum(a.total_pages) as TotalPages, 
 sum(a.used_pages) as UsedPages, 
 sum(a.data_pages) as DataPages,
 (sum(a.total_pages) * 8) / 1024 as TotalSpaceMB, 
 (sum(a.used_pages) * 8) / 1024 as UsedSpaceMB, 
 (sum(a.data_pages) * 8) / 1024 as DataSpaceMB
FROM 
 sys.tables t
INNER JOIN 
 sys.indexes i ON t.OBJECT_ID = i.object_id
INNER JOIN 
 sys.partitions p ON i.object_id = p.OBJECT_ID AND i.index_id = p.index_id
INNER JOIN 
 sys.allocation_units a ON p.partition_id = a.container_id
WHERE 
 t.NAME NOT LIKE 'dt%' AND
 i.OBJECT_ID > 255 AND 
 i.index_id <= 1
GROUP BY 
 t.NAME, i.object_id, i.index_id, i.name 
ORDER BY 
 SUM(a.total_pages) DESC

Das Resultat sieht ungefähr so aus:

VCHistStat01Die Verursacher der vollen Datenbank sind schnell ausgemacht. Es handelt sich um Tabellen mit alten Leistungsdaten, die sich in vier Gruppen aufteilen:

  1. VPX_HIST_STAT1_n  (Tag)
  2. VPX_HIST_STAT2_n  (Woche)
  3. VPX_HIST_STAT3_n  (Monat)
  4. VPX_HIST_STAT4_n  (Jahr)

Im beschriebenen Fall sind die Leistungsdaten der Serie 2 (Wochenstatistiken) die Hauptursache.

Ablauf

  • vCenter Server stoppen (falls es noch läuft)
  • Im Management Studio die Tabellen VPX_HIST_STAT2_1 bis VPX_HIST_STAT2_n mit dem Befehl TRUNCATE TABLE leeren. Das kann unter Umständen mühsam sein, da man über 80 Tabellen zu leeren hat. Besser ist daher die Verwendung eines Skriptes.
  • Korrespondierende Sample Time Tabelle leeren: TRUNCATE TABLE VPX_SAMPLE_TIME2

Truncate Script

Eleganter geht es mit einem Skript welches bei StopDoingITWrong publiziert wurde. Dieses löscht die  gesamte Statistik Historie und auch die korrespondierenden Sampletime Tabellen.

Achtung! Benutzung auf eigenes Risiko. Vorher unbedingt einen Snapshot oder einen Datenbank Dump anlegen!

Declare @current_table varchar(100)
declare @sqlstatement nvarchar(4000)
--move declare cursor into sql to be executed
set @sqlstatement = 'Declare table_cursor CURSOR FOR SELECT name FROM sys.tables where name like ''VPX_HI%'' or name like ''VPX_SAMPLE%'''

exec sp_executesql @sqlstatement

OPEN table_cursor
FETCH NEXT FROM table_cursor
INTO @current_table

WHILE @@FETCH_STATUS = 0
BEGIN
set @sqlstatement = 'truncate table ' + @current_table
exec sp_executesql @sqlstatement

FETCH NEXT FROM table_cursor
INTO @current_table

END
CLOSE table_cursor
DEALLOCATE table_cursor

Anschliessend die Datenbank verkleinern (Shrink). Dazu die Datenbank im Management Studio auswählen und im Kontextmenü [Tasks > Shrink > Database>] wählen.

Ergebnis nach Truncate und Shrink

VCHistStat03Ein Blick auf die Datenbank Dateien zeigt das Ergebnis.

VCHistStat04

Start vCenter Service

Letztlich sollte man nicht vergessen, den vCenter Dienst neu zu starten. Die Anmeldung mit vSphere Client oder Webclient sollte danach wieder problemlos funktionieren.

Links

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert