DataFrameサービスメトリクス
- 更新日2025-12-02
- 9分で読める
OpenTelemetryメトリックおよびPrometheusメトリックを使用して、SystemLink Enterprise DataFrameサービスの状態を監視します。
DataFrameサービスによって発行されるメトリクスおよび関連する依存項目については、以下の表を参照してください。
メモ OpenTelemetryコレクターをデプロイおよび構成し、すべてのOpenTelemetryメトリックをPrometheusメトリックとして公開できます。これらのメトリックをPrometheusに公開することで、Grafanaなどのツールでメトリックを表示できます。
ni.dataframe.row_data_store.{object_storage}_stream_poolを含むメトリックの場合は、サービスにより{object_storage}がs3またはazureに置換されます。どちらに置換されるかは、サービスが接続されているオブジェクトストレージプロバイダによって異なります。サービスは、メトリックの送信時に自動的に置換を実装します。
DataFrameサービス
| KPI? | メトリック | タイプ | 説明 | ラベル |
|---|---|---|---|---|
| はい | ni.dataframe.staged_row_data_processor.staging.files.found.count | カウンタ | ストレージで検出されたステージングファイルの数。 ni.dataframe.staged_row_data_processor.staging.files.orphaned.countと一緒に使用すると、サービスのファイル処理が遅れているかどうかを確認できます。 |
なし |
| はい | ni.dataframe.staged_row_data_processor.staging.files.orphaned.count | カウンタ | 孤立ファイルとして削除されたステージングファイルの数。 ni.dataframe.staged_row_data_processor.staging.files.found.countと一緒に使用すると、サービスのファイル処理が遅れているかどうかを確認できます。理想的な状況では、このメトリックはゼロです。次のいずれかの場合、Xを超える値が発生する可能性があります。
|
なし |
| はい | ni.dataframe.staged_row_data_processor.staging.files.missing.count | カウンタ | 見つからないステージングファイルの数。 このメトリックは、以下の問題のいずれかを示します。
|
なし |
| はい | ni.dataframe.staged_row_data_processor.claims.lost.count | カウンタ | 処理中に失われた要求の数。 このメトリックは、以下の問題のいずれかを示します。
|
なし |
| はい | ni.dataframe.staged_row_data_processor.claims.with.errors.count | カウンタ | 処理中にエラーが発生した要求の数。 0より大きい値は、サービスが500個のエラーを返しているとして扱います。 |
ni_dataframe_staged_row_data_processor_phase: [1, 2] |
| いいえ | ni.dataframe.staged_row_data_processor.skipped.storage.ids.count | カウンタ | 処理されなかった検出済みストレージIDの数。 | なし |
| いいえ | ni.dataframe.staged_row_data_processor.failed.to.claim.count | カウンタ | 要求されていない検出済みストレージIDの数。 | なし |
| いいえ | ni.dataframe.staged_row_data_processor.claims.processed.count | カウンタ | 処理された要求の数。 | ni_dataframe_staged_row_data_processor_phase: [1, 2] |
| いいえ | ni.dataframe.staged_row_data_processor.sent.notifications.count | カウンタ | 送信された通知の数。 | なし |
| いいえ | ni.dataframe.row_data_store.{object_storage}_stream_pool.blocks.count | カウンタ | オブジェクトストレージのストリームプール内の空きブロックの数。 | なし |
| いいえ | ni.dataframe.row_data_store.{object_storage}_stream_pool.allocations.count | カウンタ | オブジェクトストレージのストリームプールで割り当てられているブロックの数。 | なし |
| いいえ | ni.dataframe.row_data_store.{object_storage}_stream_pool.discards.count | カウンタ | オブジェクトストレージのストリームプールから破棄されたバッファの数。 | なし |
| いいえ | ni.dataframe.row_data_store.{object_storage}_stream_pool.free.size.bytes | カウンタ | オブジェクトストレージのストリームプールで割り当てられているが未使用のバイト数。 | なし |
| いいえ | ni.dataframe.row_data_store.{object_storage}_stream_pool.used.size.bytes | カウンタ | オブジェクトストレージのストリームプールで現在使用中のバイト数。 | なし |
| はい | ni.dataframe.table_reaper.tables.reaped.count | カウンタ | 削除されたテーブルの数。 このメトリックは、テーブルのクリーンアップを監視するために使用します。 |
ni_dataframe_table_reaper_reaped_result: [deleted, skipped, failed] |
| はい | ni.dataframe.tables.appendable.count | ゲージ | 追加可能なアクティブテーブルの数。 このメトリックを使用して、追加可能テーブル数を追加可能テーブルの制限と比較します。 |
なし |
| はい | ni.dataframe.iceberg_operations.duration | ヒストグラム | Iceberg操作の継続時間です。 |
|
DataFrameサービス依存項目
使用可能なその他のパフォーマンスメトリックとその使用方法については、DataFrameサービスの依存項目のドキュメントを参照してください。
| 依存項目 | 情報の入手先 |
|---|---|
| ASP.NET | ASP.NETメトリックのリストについては、「ASP.NET Coreメトリック」および「ASP.NETランタイムのメトリック」を参照してください。 |
| Kubernetes | Kubernetesメトリックのリストについては、「Kubernetesメトリックのリファレンス」、「cAdvisorメトリック」、「kube-state-metricsドキュメント」を参照してください。 |
| Dremio | Dremioメトリックのリストについては、「利用可能なJMXメトリック」を参照してください。 |
関連コンテンツ
- OpenTelemetry Webサイト
- Prometheus Webサイト
- cAdvisorのメトリック
- アラームサービスメトリック
OpenTelemetryメトリックおよびPrometheusメトリックを使用して、SystemLink Enterpriseアラームサービスの状態を監視します。
- ASP.NET Coreのメトリック
- ASP.NETランタイムのメトリック
- Kubernetes Metricsリファレンス
- kube-state-metricsドキュメント
- 利用可能なJMX指標