Hintergrund: Zeitreihen
Amazon Timestream ist speziell auf Daten in Zeitreihen (englisch: time-series data) ausgerichtet. Bei solchen Daten geht es um die Veränderung über Zeit – beispielsweise den Verlauf von Temperaturen, Aktienkursen oder die verbleibende Kraftstoffmenge in einer Flotte von LKW. Diese Daten bilden die Grundlage von vielen Visualisierungen, insbesondere Verlaufsgraphen.
Charakteristisch sind triviale Daten – oft nur {Zeitpunkt, Gerätenummer, Messwert}. Jedoch werden über eine längere Zeit extrem viele Werte generiert, in manchen Anwendungsfällen sogar viele Werte pro Gerät und Sekunde. Insbesondere in IoT-Szenarien sind viele tausende Geräte oder Sensoren nicht unüblich, sodass schnell schwindelerregend viele Datenpunkte anfallen. Aus diesem Grunde kommen generische Datenbanksysteme schnell an ihre Grenzen. Insbesondere die sehr häufige Auswertung, wie sie beispielsweise für Echtzeit-Visualisierungen notwendig ist, führt schnell zu Engpässen.
Amazon Timestream positioniert sich hier als AWS-native Konkurrenz zu spezialisierten Produkten wie Timescale und InfluxDB.
Stärken von Amazon Timestream
Datenabfrage per SQL: Timestreams SQL-Dialekt ist für den Umgang mit Zeitwerten und deren Auswertung optimiert.
Stufenlose Abfrage: Im Gegensatz zu Konkurrenzprodukten muss bei Abfragen nicht zwischen Live-Daten und archivierten Daten unterschieden werden.
Serverless: Keinerlei Provisionierung, Dimensionierung, Wartung erforderlich: Es können in quasi unbegrenzter Menge und Frequenz Daten gespeichert und abgefragt werden. Berechnet wird ausschließlich die tatsächliche Nutzung.
Hochverfügbar: Timestream ist über mehrere Rechenzentren (Availability Zones) hinweg redundant.
Schwächen von Amazon Timestream
Timestream ist ein sehr junges Produkt. Es ist also nicht überraschend, dass noch einige Ecken und Kanten vorhanden sind:
Keine historischen Daten: Übermittelte Daten müssen sich immer auf den aktuellen Zeitpunkt beziehen (mit etwas Spielraum). Eine Migration historischer Daten aus einem bestehenden System ist also nicht möglich.
Keine SSD-Speicher: Für die Daten stehen bisher nur magnetische Speicher zur Verfügung; optionale Speicherung auf SSDs ist aber bereits angekündigt.
Nicht in Deutschland verfügbar: Timestream steht bisher nur in wenigen Regionen zur Verfügung; innerhalb Europas nur in Irland (Region eu-west-1).
Zugriff nur via API: Abfragen und Schreiben ist nur via AWS SDK oder CLI möglich. Eine direkte Abfrage via klassischer SQL-Protokolle ist nicht möglich (ein JDBC-Treiber ist aber verfügbar).
Integrationen
Obwohl Timestream noch sehr jung ist, sind schon sehr viele Möglichkeiten zur Integration mit anderen Produkten verfügbar oder angekündigt, zum Beispiel:
- AWS IoT Core
- Amazon QuickSight (Business Intelligence)
- Amazon SageMaker (Machine Learning)
- Grafana (freie Software zur bemerkenswert hübschen Darstellung von Metriken)
- Prometheus (beliebte freie Software bzw. Schnittstelle für das Bereitstellen und Verarbeiten von Metriken)
Fazit
Mit Amazon Timestream ergänzt AWS sein Angebot um eine zunehmend wichtige Variante der zweckoptimierten Datenbanken. Bereits in seiner jetzigen Form ist Timestream vielversprechend und wird das Rückgrat vieler neuer Anwendungen werden.