配置文件存储
- 更新时间2025-12-02
- 阅读时长11分钟
部分SystemLink Enterprise服务需要文件存储提供程序。
- Amazon S3存储
- Amazon S3兼容存储
- Azure Blob存储
下表列出的Amazon S3存储和Azure Blob存储参数通常可在多种配置之间共享。该共享通过Helm值文件中的YAML锁定语法实现。该语法为值文件提供了便捷的通用配置共享方式,同时支持通过自定义值重写单独引用项。
Amazon S3和Amazon S3兼容存储提供程序
在AWS/aws-supplemental-values.yaml Helm配置文件或OnPrem/storage-values.yaml Helm配置文件中设置以下配置。有关部署配置到环境中的更多信息,请参阅更新SystemLink Enterprise。
可在AWS/aws-secrets.yaml文件、OnPrem/storage-secrete.yaml文件或直接在簇上配置密钥引用。有关管理文件存储所需配置密钥的详细信息,请参阅必需的密钥。
| 2025-07版本之前的参数 | 2025-07版本之后的参数 | 详细信息 |
|---|---|---|
|
不适用 |
|
该值表示服务存储类型。设置值为s3。 |
|
|
该值表示存储提供程序服务端口号。 |
|
|
该值表示存储提供程序服务主机名称。 |
|
|
该值表示存储提供程序服务方案。该值通常为https。 |
|
|
该值表示S3 bucket所在的AWS区域。 |
|
未改变 |
处理<ATTENTION>标记。 这些设置可配置Data Frame服务所需的分布式存储。 |
|
未改变 |
用于连接存储提供程序服务的凭据的密钥名称。 |
通过IAM将服务连接到S3
分配IAM角色以将服务连接到Amazon S3。
- 为每个服务创建一个账户,方法是设置以下Helm值:serviceAccount: create: true。
- 创建一个包含以下声明的IAM策略:
"Action": [ "s3:PutObject", "s3:ListBucket", "s3:GetObject", "s3:DeleteObject", "s3:AbortMultipartUpload" ], "Effect": "Allow", "Resource": [ "<s3_bucket_ARN>/*", "<s3_bucket_ARN>" ]
备注 <s3_bucket_ARN>占位符表示该服务的S3 bucket的Amazon资源名称。 - 创建一个应用新IAM策略的IAM角色。备注 每个IAM角色必须使用以下命名规范:<release-name>-<service-name>-role。例如,systemlink-feedservice-role。
满足这些先决条件后,更新Helm值文件以包含以下配置。
| 服务 | 配置 |
|---|---|
| DataFrame服务 | 此服务当前不支持IAM。 |
| 订阅源服务 |
feedservice:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
feedservice:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-feedservice-role"
|
| 文件引入服务 |
fileingestion:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
fileingestion:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-fileingestion-role"
|
| Notebook执行服务 |
nbexecservice:
storage:
s3:
authType: "AWS_WEB_IDENTITY_TOKEN"
nbexecservice:
serviceAccount:
annotations:
eks.amazonaws.com/role-arn: "arn:aws:iam::<account-id>:role/<release-name>-executions-role"
|
Azure Blob存储提供程序
在Azure Blob存储的Azure/azure-supplemental-values.yaml Helm配置文件中设置以下配置。
可在Azure/azure-secrets.yaml文件中或直接在集群上配置密钥引用。有关部署这些配置到环境中的更多信息,请参阅更新SystemLink Enterprise。
| 从2025-07版本开始的参数 | 详细信息 |
|---|---|
|
该值表示服务存储类型。设置值为azure。 |
|
该值表示Azure Blob存储的主机(不含帐户名称)。例如,可将值设置为blob.core.windows.net或blob.core.usgovcloudapi.net。 如果存储未使用默认端口,请将端口添加至主机的末尾。例如,blob.core.windows.net:1234。 |
|
该值表示要连接的Azure Data Lake Storage主机和端口(不含帐户名称)。例如,可将值设置为dfs.core.windows.net。 如果存储未使用默认端口,请将端口添加至主机的末尾。例如:dfs.core.windows.net:1234。 |
|
该值表示服务的存储帐户。NI建议对于不同的服务使用不同的存储帐户。 |
文件存储的限制和成本注意事项
如需调整文件存储服务的限制和成本注意事项,请参阅下列配置。
| 注意事项 | 配置 |
|---|---|
| 降低存储成本 |
如需清理未完成的分段上传,请配置服务。如果您使用的是Amazon S3,请在S3 bucket上配置AbortIncompleteMultipartUpload值。
备注 Azure存储将在七天后自动删除未提交的数据块。有关其他S3兼容提供程序的信息,请参阅提供程序文档。 |
| 调整单个用户每秒可上传的文件数量 |
配置fileingestion.rateLimits.upload值。 默认值为每个用户每秒3个文件。通过跨副本的负载平衡,有效速率高于指定速率。 |
| 调整用户可上传的最大文件大小 |
配置fileingestion.uploadLimitGB值。 默认情况下,值为2 GB。 |
| 调整单个副本用于获取数据的并发请求数量 |
配置dataframeservice.rateLimits.ingestion.requestLimit值。 |
相关内容
- Amazon S3 API参考
- 利用加密保护Amazon S3数据
- 升级SystemLink Enterprise
修改配置或升级到较新版本的SystemLink Enterprise应用程序。
- 必需的密钥
密钥是用于存储敏感信息的Kubernetes对象。除非另有说明,否则本主题中列出的密钥都是必需的,并且是不透明密钥。
- SystemLink值Helm模板
- SystemLink Azure补充值Helm模板
- SystemLink AWS补充值Helm模板
- SystemLink密钥Helm模板
- SystemLink Azure密钥Helm模板
- 配置桶生命周期策略以删除在GCS未完成的分段上传
- GCS Amazon S3互操作API参考
- XML请求的IAM权限
- Blob的软删除功能
- Azure Data Lake Storage的分层命名空间