自动归一化传入数据
- 更新时间2025-05-12
- 阅读时长2分钟
创建程序将输入的数据文件自动转换为数据表。
- 在SystemLink Web应用程序中,导航至 。
- 单击Python 3 (ipykernel)。
-
使用链接的示例作为模板创建ETL管道。
该范例包含完成下列操作的步骤。
- 提取文件内容。
- 将数据转换为数据表格式。
- 使用DataFrame Service API将数据加载到存储中。
注: 创建数据表时,必须执行下列操作。- 定义列类型。
- 定义每列的数据类型。
- 定义列的总数。列总数不能超过2500。
列类型 说明 NORMAL 该列没有特殊属性。该行为是默认行为。 INDEX 该列为每行提供一个唯一值。每个数据表都必须有一个INDEX列,数据类型如下。 - INT32
- INT64
- TIMESTAMP
NULLABLE 该列允许行的索引值为null。追加数据行时,可以排除NULLABLE列。追加的行在相应的列使用null值。 注: 在完成向表格追加数据后,释放与表格关联的资源。使用连线POST /nidataframe/v1/tables/{id}/data,其中{id}是数据表ID。在请求的JSON正文中将endOfData设置为true。 -
创建程序以执行notebook并为事件指定 上传的文件 。有关如何创建程序,请参阅使用程序 自动执行操作。
创建文件后,notebook把文件数据转换为数据表。
从仪表板 | 单击仪表板中数据表区域的顶部,然后选择检查(Inspect)。单击下载CSV。 注: 根据仪表板的查询设置,抽取已下载的数据表。 |
从测试结果 | 在数据表选项卡上选择一个数据表并单击下载CSV。 注: 从测试结果下载的数据表未经过抽取。 |
相关内容
- 归一化数据实现高效的存储和访问
数据表是易于读取,按列存储的数据存储格式,用于百万行级别的数据存储。
- 使用程序自动执行操作
创建程序以在事件发生时自动执行操作。
- ETL范例