人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • image.png

    阿里云服务器如何使用快照创建云盘?

    阿里云服务器如何使用快照创建云盘? 如果您需要读取已有云盘或者误释放云盘的数据,进行数据提取或者故障分析,可以通过使用快照创建云盘实现,对应的历史云盘可以是系统盘或数据盘。 前提条件 您已经为已有系统盘或数据盘创建了快照,并获取快照ID。具体操作,请参见创建一个云盘快照。 注意事项 使用快照创建云盘,您要注意以下事项: 不支持合并多块云盘。云盘创建后,每块云盘都是独立个体,无法通过格式化将多块云盘空间合并到一起。建议您提前做好云盘数量和容量的规划。 已创建的多块云盘,不建议制作LVM(Logic…

  • 阿里云国际站如何提交工单?

    阿里云国际站如何提交工单?

    阿里云国际站如何提交工单? 在实际使用中,有很多问题需要去提交工单,让阿里云工程师给排查解决。虽然云枢国际属于阿里云渠道合作伙伴,但是,权限非常受限,只能拓客、充值、提供云上解决方案以及基础云产品售前、售后技术指导,而若是遇到云产品故障,或者配置问题,使用异常等情况,就需要会提交工单,让阿里云工程师排查解决了。下面就简单介绍下,阿里云国际站,如何提交工单。 1,先进入阿里云国际站控制台。(阿里云国际站网址:https://www.alibabacloud.com/zh) 2,点击右上角“工单” …

    常见问答 2023年12月26日
  • 传统

    使用阿里云CDN加速OSS源站的方法步骤

    使用阿里云CDN加速OSS源站的方法步骤 使用CDN可以更快地访问OSS资源。直接访问OSS资源可能会受到OSS下行带宽和Bucket地域的限制。相比直接访问OSS资源,CDN具有更高的带宽上限,可以将OSS的资源缓存至就近的CDN节点,从而通过CDN节点进行分发,同时费用更低。本文介绍如何使用CDN来加速OSS的访问。 前提条件1,已创建一个OSS Bucket,且上传了相关资源。 2,已开通阿里云CDN服务。详情请参见开通CDN服务。 背景信息为了更好地应对访问量的增长,并避免性能瓶颈,建议…

    阿里云CDN 2023年8月1日
  • DDoS高防(国际)保险防护和无限防护计费说明-中国站

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的?

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的? 本文介绍了DDoS高防(国际)保险防护和无限防护的计费相关内容。 计费项 说明 : 各计费项的实际价格以DDoS高防(国际)购买页为准。 最小规格实例的单价及规格详情,请参见下表。 实例类型 实例单价 实例规格 保险防护实例 2,630美元/月 业务带宽:100 Mbps 95弹性业务带宽模式:不启用 功能套餐:标准套餐 防护域名数:10个(接入防护的域名所属的一级域名总数不超过1个) 业务QPS:500次/秒 95弹性QPS模式:不启用…

    阿里云DDoS 防护 2023年8月2日
  • Web应用防火墙回源IP网段列表

    WAF最佳实践之重保场景防护

    WAF最佳实践之重保场景防护 重要节假日、攻防演练或重要活动保障期间,Web应用对于攻击的容忍度极低。为应对这种情况,您可以通过配置基础防护和重保场景防护策略,制定更加精准和定制化的防御模式,提升特定时间段的防护效果。本文介绍如何配置重保期间的防护策略。 前提条件 已开通WAF 3.0服务。具体操作,请参见开通包年包月WAF 3.0、开通按量付费WAF 3.0。 已开通重保场景防护功能。具体操作,请参见重保场景防护。 配置流程 步骤一:确保资产已全部接入WAF在配置重保期间的防护策略前,首先要确…

  • nginx

    如何在Linux系统下手动搭建WordPress个人博客站点?

    如何在CentOS 8系统下手动搭建WordPress个人博客站点? WordPress是使用PHP语言开发的博客平台,在支持PHP和MySQL数据库的服务器上,您可以用WordPress架设自己的网站,也可以用作内容管理系统(CMS)。本教程介绍如何在Linux操作系统的ECS实例上搭建WordPress网站。 前提条件 已创建Linux操作系统的ECS实例,并且手动部署LNMP环境,具体操作,请参见手动部署LNMP环境(CentOS 8)。本教程使用的相关资源版本如下。 实例规格:ecs.c…

联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部