DataFrame-Dienstmetriken
- Aktualisiert2025-12-02
- 3 Minute(n) Lesezeit
Überwachen Sie den Zustand des SystemLink Enterprise DataFrame-Dienstes mit Hilfe von OpenTelemetry-Metriken und Prometheus-Metriken.
Für die Metriken, die ni.dataframe.row_data_store.{object_storage}_stream_pool enthalten, ersetzt der Dienst {object_storage} durch s3 oder azure, abhängig vom Objektspeicherprovider, mit dem der Dienst verbunden ist. Der Dienst ersetzt die Variable automatisch, wenn die Metriken ausgegeben werden.
DataFrame-Dienst
| KPI? | Metrik | Typ | Beschreibung | Kennzeichnung |
|---|---|---|---|---|
| Ja | ni.dataframe.staged_row_data_processor.staging.files.found.count | Zähler | Die Anzahl der im Datenspeicher gefundenen Stufendateien. Verwenden Sie die Metrik mit ni.dataframe.staged_row_data_processor.staging.files.orphaned.count, um zu erkennen, ob der Dienst bei der Verarbeitung von Dateien zurückfällt. |
Keine |
| Ja | ni.dataframe.staged_row_data_processor.staging.files.orphaned.count | Zähler | Die Anzahl der als verwaiste Objekte gelöschten Stufendateien. Verwenden Sie die Metrik mit ni.dataframe.staged_row_data_processor.staging.files.found.count, um zu erkennen, ob der Dienst bei der Verarbeitung von Dateien zurückfällt. Bei einer idealen Operation ist diese Metrik Null. Eine der folgenden Situationen kann einen Wert größer als X verursachen.
|
Keine |
| Ja | ni.dataframe.staged_row_data_processor.staging.files.missing.count | Zähler | Die Anzahl der fehlenden Stufendateien. Diese Metrik deutet auf eines der folgenden Probleme hin.
|
Kein |
| Ja | ni.dataframe.staged_row_data_processor.claims.lost.count | Zähler | Die Anzahl der während der Verarbeitung verlorenen Claims. Diese Metrik deutet auf eines der folgenden Probleme hin.
|
Kein |
| Ja | ni.dataframe.staged_row_data_processor.claims.with.errors.count | Zähler | Die Anzahl der Claims, bei denen Fehler während der Verarbeitung aufgetreten sind. Behandeln Sie Werte größer als Null so, als ob der Dienst 500-Fehler zurückgibt. |
ni_dataframe_staged_row_data_processor_phase: [1, 2] |
| Nein | ni.dataframe.staged_row_data_processor.skipped.storage.ids.count | Zähler | Die Anzahl der erkannten Datenspeicher-IDs, die nicht verarbeitet wurden. | Kein |
| Nein | ni.dataframe.staged_row_data_processor.failed.to.claim.count | Zähler | Die Anzahl der erkannten Speicher-IDs ohne Claim. | Kein |
| Nein | ni.dataframe.staged_row_data_processor.claims.processed.count | Zähler | Die Anzahl der verarbeiteten Claims. | ni_dataframe_staged_row_data_processor_phase: [1, 2] |
| Nein | ni.dataframe.staged_row_data_processor.sent.notifications.count | Zähler | Die Anzahl der gesendeten Benachrichtigungen. | Kein |
| Nein | ni.dataframe.row_data_store.{object_storage}_stream_pool.blocks.count | Zähler | Die Anzahl der freien Blöcke im Stream-Pool für den Objektspeicher. | Kein |
| Nein | ni.dataframe.row_data_store.{object_storage}_stream_pool.allocations.count | Zähler | Die Anzahl der im Stream-Pool für den Objektspeicher zugewiesenen Blöcke. | Kein |
| Nein | ni.dataframe.row_data_store.{object_storage}_stream_pool.discards.count | Zähler | Die Anzahl der aus dem Stream-Pool für den Objektspeicher verworfenen Puffer. | Kein |
| Nein | ni.dataframe.row_data_store.{object_storage}_stream_pool.free.size.bytes | Zähler | Die Anzahl der zugewiesenen, aber nicht im Stream-Pool für den Objektspeicher verwendeten Bytes. | Kein |
| Nein | ni.dataframe.row_data_store.{object_storage}_stream_pool.used.size.bytes | Zähler | Die Anzahl der aktuell vom Stream-Pool für den Objektspeicher verwendeten Bytes. | Kein |
| Ja | ni.dataframe.table_reaper.tables.reaped.count | Zähler | Die Anzahl der gelöschten Tabellen. Verwenden Sie diese Metrik, um die Bereinigung von Tabellen zu überwachen. |
ni_dataframe_table_reaper_reaped_result: [gelöscht, übersprungen, fehlgeschlagen] |
| Ja | ni.dataframe.tables.appendable.count | Rundinstrument | Die Anzahl der aktiven Tabellen, die angehängt werden können. Verwenden Sie diese Metrik, um die Anzahl der anhängbaren Tabellen mit dem Grenzwert zu vergleichen. |
Kein |
| Ja | ni.dataframe.iceberg_operations.duration | Histogramm | Dauer von Iceberg-Operationen. |
|
Abhängige Komponenten des DataFrame-Dienstes
| Abhängigkeit | Informationen finden |
|---|---|
| ASP.NET | Eine Liste der von ASP.NET bereitgestellten Metriken finden Sie unter ASP.NET Core Metrics und ASP.NET Runtime Metrics. |
| Kubernetes | Eine Liste der von Kubernetes bereitgestellten Metriken finden Sie in der Referenz zu Kubernetes-Metriken, cAdvisor Metrics und der kube-state-metrics-Dokumentation. |
| Dremio | Eine Liste der Dremio-Metriken finden Sie unter Available JMX-Metrik. |
Verwandte Inhalte
- OpenTelemetry-Webseite
- Prometheus-Webseite
- cAdvisor-Metriken
- Alarmdienst-Metriken
Überwachen Sie den Zustand des SystemLink Enterprise-Alarmdienstes mit Hilfe von OpenTelemetry-Metriken und Prometheus-Metriken.
- ASP.NET-Core-Metriken
- ASP.NET-Runtime-Metriken
- Referenz zu Kubernetes-Metriken
- kube-state-metrics-Dokumentation
- Verfügbare JMX-Metriken