Configuration du stockage de fichiers
- Mise à jour2025-12-02
- Temps de lecture : 5 minute(s)
Plusieurs services SystemLink Enterprise requièrent un fournisseur de stockage de fichiers.
- Stockage Amazon S3
- Stockage compatible avec Amazon S3
- Stockage Blob Azure
Les paramètres mentionnés dans les tableaux suivants pour le stockage Amazon S3 et Blob Azure sont généralement partagés entre plusieurs configurations. Ce partage s'effectue grâce à la syntaxe d'ancrage YAML dans les fichiers de valeurs Helm. Cette syntaxe offre un moyen pratique de partager une configuration commune dans l'ensemble de vos fichiers de valeurs. Vous pouvez remplacer ces valeurs par défaut par des valeurs personnalisées individuellement.
Fournisseurs de stockage Amazon S3 et compatibles Amazon S3
Définissez la configuration suivante dans votre fichier de configuration Helm AWS/aws-supplemental-values.yaml ou OnPrem/storage-values.yaml. Pour en savoir plus sur le déploiement de configurations dans votre environnement, consultez Mise à jour de SystemLink Enterprise.
Vous pouvez configurer des références à des secrets dans les fichiers AWS/aws-secrets.yaml, OnPrem/storage-secrete.yaml ou directement sur le cluster. Pour en savoir plus sur la gestion des secrets nécessaires à la configuration du stockage de fichiers, consultez Secrets requis.
| Paramètres avant la version 2025-07 | Paramètres après la version 2025-07 | Détails |
|---|---|---|
|
N'est pas applicable |
|
Cette valeur représente le type de stockage du service. Attribuez la valeur s3. |
|
|
Cette valeur représente le numéro du port de service du fournisseur de stockage. |
|
|
Cette valeur représente le nom d'hôte du service du fournisseur de stockage. |
|
|
Cette valeur représente le schéma de service du fournisseur de stockage. Cette valeur est généralement https. |
|
|
Cette valeur représente la région AWS où se trouve le compartiment S3. |
|
Inchangée |
Traitez les marqueurs <ATTENTION>. Ces paramètres configurent le stockage distribué requis pour le service Data Frame. |
|
Inchangée |
Nom du secret contenant les identifiants pour se connecter au service du fournisseur de stockage. |
Connexion des services à S3 via IAM
Attribuez un rôle IAM pour connecter les services à Amazon S3.
- Créez un compte pour chaque service en définissant la valeur Helm suivante : serviceAccount: create: true.
- Créez une stratégie IAM avec la déclaration suivante :
"Action": [ "s3:PutObject", "s3:ListBucket", "s3:GetObject", "s3:DeleteObject", "s3:AbortMultipartUpload" ], "Effect": "Allow", "Resource": [ "<s3_bucket_ARN>/*", "<s3_bucket_ARN>" ]
Remarque L'espace réservé <s3_bucket_ARN> représente le nom de ressource Amazon pour le compartiment S3 du service. - Créez un rôle IAM qui applique la nouvelle stratégie IAM.Remarque Chaque rôle IAM doit utiliser la convention de nom suivante : <release-name>-<service-name>-role. Par exemple, systemlink-feedservice-role.
Une fois ces conditions remplies, mettez à jour le fichier de valeurs Helm pour inclure les configurations suivantes.
| Service | Configuration |
|---|---|
| Service DataFrame | Ce service ne prend pas en charge IAM actuellement. |
| Service de flux |
feedservice:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
feedservice:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-feedservice-role"
|
| Service d'ingestion de fichiers |
fileingestion:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
fileingestion:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-fileingestion-role"
|
| Service d'exécution de notebook |
nbexecservice:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
nbexecservice:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-executions-role"
|
Fournisseurs de Stockage Blob Azure
Appliquez la configuration suivante dans le fichier de configuration Azure/azure-supplemental-values.yaml Helm pour le Stockage Blob Azure.
Vous pouvez configurer des références à des secrets dans le fichier Azure/azure-secrets.yaml ou directement sur le cluster. Pour en savoir plus sur le déploiement de ces configurations dans votre environnement, consultez Mise à jour de SystemLink Enterprise.
| Paramètres à partir de la version 2025-07 | Détails |
|---|---|
|
Cette valeur représente le type de stockage du service. Attribuez la valeur azur. |
|
Cette valeur représente l'hôte du stockage Blob Azure sans le nom du compte. Par exemple, vous pouvez attribuer la valeur blob.core.windows.net ou blob.core.usgovcloudapi.net. Si votre stockage n'utilise pas le port par défaut, ajoutez le port à la fin de l'hôte. Par exemple, blob.core.windows.net:1234. |
|
Cette valeur représente l'hôte et le port du stockage Azure Data Lake auquel se connecter sans le nom de compte. Par exemple, vous pouvez attribuer la valeur dfs.core.windows.net. Si votre stockage n'utilise pas le port par défaut, ajoutez le port à la fin de l'hôte. Par exemple : dfs.core.windows.net:1234. |
|
Cette valeur représente le compte de stockage de votre service. NI recommande d'utiliser différents comptes de stockage pour différents services. |
Limites et considérations financières pour le stockage de fichiers
Pour ajuster les limites et les coûts des services de stockage de fichiers, reportez-vous aux configurations suivantes.
| Considération | Configuration |
|---|---|
| Réduire les coûts de stockage |
Pour supprimer les chargements en plusieurs parties incomplets, attribuez la configuration appropriée à votre service. Si vous utilisez Amazon S3, attribuez la valeur AbortIncompleteMultipartUpload à vos compartiments S3.
Remarque Le stockage Azure supprime automatiquement les blocs non validés au bout de sept jours. Pour les autres fournisseurs compatibles S3, reportez-vous à la documentation du fournisseur. |
| Ajuster le nombre de fichiers qu'un seul utilisateur peut télécharger par seconde |
Configurez la valeur fileingestion.rateLimits.upload. Par défaut, la valeur est de 3 fichiers par seconde et par utilisateur. En équilibrant la charge entre les répliques, la vitesse effective est supérieure à la vitesse spécifiée. |
| Ajuster la taille de fichier maximale que les utilisateurs peuvent télécharger |
Configurez la valeur fileingestion.uploadLimitGB. Par défaut, cette valeur est de 2 Go. |
| Ajuster le nombre de requêtes simultanées qu'un seul duplicata peut servir pour ingérer des données |
Configurez la valeur dataframeservice.rateLimits.ingestion.requestLimit. |
Contenu associé
- Référence de l'API Amazon S3
- Protection des données Amazon S3 avec cryptage
- Mise à jour de SystemLink Enterprise
Modifiez la configuration ou effectuez une mise à niveau vers une version plus récente de l'application SystemLink Enterprise.
- Secrets requis
Les secrets sont des objets Kubernetes qui permettent de stocker des informations confidentielles. Les secrets mentionnés dans cette rubrique sont requis et sont de type Opaque (sauf indication contraire).
- Modèle Helm des valeurs SystemLink
- Modèle Helm des valeurs supplémentaires pour SystemLink Azure
- Modèle Helm des valeurs supplémentaires pour SystemLink AWS
- Modèle Helm SystemLink Secrets
- Modèle Helm SystemLink Azure Secrets
- Configuration d'une configuration de cycle de vie de compartiment pour supprimer les chargements partitionnés incomplets dans GCS
- Référence de l'API d'interopérabilité GCS Amazon S3
- Autorisations IAM pour les requêtes XML
- Suppression réversible d'objets blob
- Espace de noms hiérarchique du stockage Azure Data Lake