AI Lab Release Notes¶
本页列出 AI Lab 各版本的 Release Notes,便于您了解各版本的演进路径和特性变化。
Note
标记为 Beta 的功能更新,在使用时请多注意,如遇问题请及时反馈。
2024-10-31¶
v0.10.0¶
功能¶
- 新增 
训练任务支持在配置 vGPU 资源时指定使用的显卡类型。 - 新增 
数据集支持 Huggingface 数据源,可下载其海量模型和数据集。 - 新增 
数据集支持 Modelscope 数据源,可下载其海量模型和数据集。 - 新增 支持 
数据集的 跨命名空间 引用能力。 - 新增 
推理服务支持在配置 vGPU 资源时指定使用的卡类型。 - 新增 
运维控制台GPU 管理模块,支持查看卡级别的监控和指标信息。 - 新增 适配 
沐曦GPU 卡。 
优化¶
- 优化 数据集更新界面,提供更多配置更新能力。
 - 优化 调整了 Notebook 的入口位置,提升访问便捷性。
 
2024-09-30¶
v0.9.0¶
Note
产品模块名称从 智能算力 升级为 AI Lab。
- 新增 全新数据管理子模块 
数据标注,可管理主流数据类型的数据标注能力。 - 新增 全新模型管理子模块 
模型列表,可快速创建模型,支持模型多版本管理。 - 新增 
数据集创建时可指定使用 PVC 存储空间大小。 - 新增 支持 
训练任务一键重启。 - 新增 
baize-notebook基础镜像升级到 v0.9.0。 - 优化 支持 集群异常时,全局提醒同时保证数据可用。
 
2024-08-31¶
v0.8.0¶
- 新增 [Beta] 支持 
Notebook运行中时,手工保存为镜像(依赖镜像仓库模块)。 - 新增 [Beta] 支持 
Notebook关闭时自动保存为镜像(依赖镜像仓库模块)。 - 新增 支持 
Notebook镜像通过表单选择镜像仓库内的私有镜像。 - 新增 支持 
Notebook配置 数据输入、数据输出,可直接关联数据集。 - 新增 支持 
Notebook配置以Root身份启动。 - 新增 支持 
训练任务配置 数据输入、数据输出,可直接关联数据集。 - 新增 [Beta] 支持 
训练任务支持配置 断点续训,自动检测任务故障后自动修复。 - 新增 支持 
训练任务镜像通过表单选择镜像仓库内的私有镜像。 - 新增 支持 
训练任务详情增加展示任务参数信息。 - 新增 
环境管理可查询预热进度,并支持快速调试入口。 - 新增 支持 
推理任务详情增加服务调用监控。 - 新增 
baize-notebook基础镜像升级到 v0.8.0。 
2024-07-31¶
v0.7.0¶
- 新增 支持 
数据集创建数据集后可查询预热进度,并支持快速调试入口。 - 新增 支持 
训练任务创建MxNet单机和分布式任务。 - 新增 支持 
训练任务创建MPI分布式任务。 - 新增 支持 
训练任务支持默认镜像,统一使用基础镜像。 - 新增 支持 
训练任务启动命令可直接配置启动脚本。 - 新增 支持 
训练任务运行参数指定工作目录位置。 - 新增 支持 
推理任务详情展示API调用示例文档。 - 优化 
环境管理列表展示环境有的包管理器及Python版本。 
2024-07-10¶
v0.6.1¶
- 修复 创建推理服务时,推理框架选择使用 
Triton,托管引擎缺少vLLM选项。 
2024-06-30¶
v0.6.0¶
功能¶
- 新增 支持 创建 
Code类型的Notebook,提供原生VS Code开发体验。 - 新增 支持 快速复制 
Notebook。 - 新增 支持 在选择工作集群时,展示集群的状态信息,当失联或离线时不可选择。
 - 新增 支持 创建推理服务时,使用 
vLLM作为推理引擎,暴露原生vLLM能力。 - 新增 支持 创建推理服务时,
vLLM支持配置Lora推理参数。 - 优化 创建 
Notebook时,队列优先级默认值调整为高。 
修复¶
- 修复 
Tensorboard最小资源限制,避免因资源不足导致Tensorboard启动失败。 - 修复 优化任务状态中文描述,避免因状态描述不清晰导致的误解。
 
2024-05-30¶
v0.5.0¶
功能¶
- 新增 支持 
baizectl创建任务时同时增加Tensorboard分析看板。 - 新增 支持 
Job绑定环境管理中创建的自定义环境。 - 新增 优化 
环境管理中进行自定义环境配置更新、优化Python版本选择器等。 - 新增 支持 
推理服务详情,查看模型运行时的资源监控看板。 - 新增 支持 
推理服务绑定环境管理中创建的自定义环境。 
修复¶
- 修复 环境管理中少数情况下 
Python版本提示权限问题情况。 - 修复 推理服务在异常时不支持停止的问题。
 
2024-04-30¶
v0.4.0¶
功能¶
- 新增 
Notebook支持本地 SSH 访问,适配多种开发工具,如Pycharm、VS Code等。 - 新增 升级 
Notebook镜像,支持内置CLI工具baizectl,命令行提交和管理任务。 - 新增 
Notebook增加亲和性调度策略配置。 - 新增 分布式训练任务,可界面化配置 
SHM size。 - 新增 训练任务一键重启功能。
 - 新增 模型训练任务支持自定义指定集群调度器。
 - 新增 训练任务分析工具 
Tensorboard支持,可在Notebook与训练任务中一键启动。 - 新增 队列配额编辑时,提示当前工作空间的共享资源配置。
 - 新增 升级适配 Kueue 版本 
v0.6.2。 
修复¶
- 修复 
NotebookCRD偶现配置同步异常问题。 - 修复 
Notebook亲和性配置参数查询接口未返回。 
2024-04-01¶
v0.3.0¶
- 新增 发布 
Notebook模块,支持Jupyter Notebook等开发工具。 - 新增 发布任务中心模块,支持多种主流开发框架 
Pytorch、Tensorflow、Paddle任务训练。 - 新增 发布模型推理服务模块,支持快速部署 
Model Serving,支持任意模型算法与大语言模型。 - 新增 发布数据管理模块,支持接入 
S3、NFS、HTTP及Git等主流数据源,并支持自动数据预热。