Brand
timestream-grafana-article.png
AWSDatabase

Amazon Timestream: Unendliche Zeitreihen

Dennis Kögel, Cloud Architect, 21.10.2020

Amazons Anspruch ist es, die größte Auswahl an speziell entwickelten Datenbanken für sämtliche Anforderungen zur Verfügung zu stellen. Mit der Veröffentlichung von Amazon Timestream wird die AWS-Produktpalette um ein Datenbanksystem für Zeitreihen ergänzt. Ein typischer Anwendungsfall ist das Speichern und Auswerten von IoT-Daten.

Hintergrund: Zeitreihen

Amazon Timestream ist speziell auf Daten in Zeitreihen (englisch: time-series data) ausgerichtet. Bei solchen Daten geht es um die Veränderung über Zeit – beispielsweise den Verlauf von Temperaturen, Aktienkursen oder die verbleibende Kraftstoffmenge in einer Flotte von LKW. Diese Daten bilden die Grundlage von vielen Visualisierungen, insbesondere Verlaufsgraphen.

Charakteristisch sind triviale Daten – oft nur {Zeitpunkt, Gerätenummer, Messwert}. Jedoch werden über eine längere Zeit extrem viele Werte generiert, in manchen Anwendungsfällen sogar viele Werte pro Gerät und Sekunde. Insbesondere in IoT-Szenarien sind viele tausende Geräte oder Sensoren nicht unüblich, sodass schnell schwindelerregend viele Datenpunkte anfallen. Aus diesem Grunde kommen generische Datenbanksysteme schnell an ihre Grenzen. Insbesondere die sehr häufige Auswertung, wie sie beispielsweise für Echtzeit-Visualisierungen notwendig ist, führt schnell zu Engpässen.

Amazon Timestream positioniert sich hier als AWS-native Konkurrenz zu spezialisierten Produkten wie Timescale und InfluxDB.

Stärken von Amazon Timestream

 Datenabfrage per SQL: Timestreams SQL-Dialekt ist für den Umgang mit Zeitwerten und deren Auswertung optimiert.

 Stufenlose Abfrage: Im Gegensatz zu Konkurrenzprodukten muss bei Abfragen nicht zwischen Live-Daten und archivierten Daten unterschieden werden.

 Serverless: Keinerlei Provisionierung, Dimensionierung, Wartung erforderlich: Es können in quasi unbegrenzter Menge und Frequenz Daten gespeichert und abgefragt werden. Berechnet wird ausschließlich die tatsächliche Nutzung.

 Hochverfügbar: Timestream ist über mehrere Rechenzentren (Availability Zones) hinweg redundant.

Schwächen von Amazon Timestream

 Timestream ist ein sehr junges Produkt. Es ist also nicht überraschend, dass noch einige Ecken und Kanten vorhanden sind:

 Keine historischen Daten: Übermittelte Daten müssen sich immer auf den aktuellen Zeitpunkt beziehen (mit etwas Spielraum). Eine Migration historischer Daten aus einem bestehenden System ist also nicht möglich.

 Keine SSD-Speicher: Für die Daten stehen bisher nur magnetische Speicher zur Verfügung; optionale Speicherung auf SSDs ist aber bereits angekündigt.

 Nicht in Deutschland verfügbar: Timestream steht bisher nur in wenigen Regionen zur Verfügung; innerhalb Europas nur in Irland (Region eu-west-1).

 Zugriff nur via API: Abfragen und Schreiben ist nur via AWS SDK oder CLI möglich. Eine direkte Abfrage via klassischer SQL-Protokolle ist nicht möglich (ein JDBC-Treiber ist aber verfügbar).

Integrationen

Obwohl Timestream noch sehr jung ist, sind schon sehr viele Möglichkeiten zur Integration mit anderen Produkten verfügbar oder angekündigt, zum Beispiel:

 

Fazit

Mit Amazon Timestream ergänzt AWS sein Angebot um eine zunehmend wichtige Variante der zweckoptimierten Datenbanken. Bereits in seiner jetzigen Form ist Timestream vielversprechend und wird das Rückgrat vieler neuer Anwendungen werden.

  Zurück