用户实例¶
在“科研实例”中,用户点击实例名称,可以查看实例的基本信息、资源详情、服务和集群,并对实例进行操作。
实例详情¶
基本信息¶
基本信息显示当前实例的运行状态、运行剩余时间、健康状态、资源分配状态、创建实例所用的应用、创建时间。
资源详情¶
资源详情显示当前实例所使用的CPU核数、内存数、GPU数、块存储和镜像。
集群¶
集群显示了当前资源所使用的节点和节点的详细信息。
根据用户创建的类型不同,节点数量也不同,有的为单节点私有实例,有的为独占集群。
可以点击节点图标,切换下方的节点详细信息。
节点详细信息包含如下:
名称:节点名称。
ID:节点的ID。
类型:分为“CTRT容器”,“OCI容器”和“虚拟机”。“CTRT容器”是专为集群开发的容器,根据集群的需求可以进行更细粒度的控制。“OCI容器”是Docker的标准化容器。
角色:分为“主节点”、“工作站”和“计算节点”。“主节点”是作业队列系统的管理节点,负责接受用户提交的任务,进行任务调度和分发。“工作站”节点主要用于用户登录、作业提交、作业查看、文本编辑、数据传输等工作。“计算节点”用于处理用户的计算任务。
运行状态:显示节点当前的运行状态,例如“运行中”、“等待”、“暂停”、“错误”等等。
物理节点:显示当前节点所在的物理节点。
资源分配:当前节点所占用的资源。
资源使用统计:最近6小时的CPU和内存使用情况。
启动/停止实例¶
实例详情的右上角,有“启动”和“停止”按钮,点击后就可以运行或停止实例。
资源分配¶
注意
实例会从创建开始计费,直到自动或手动释放资源停止计费。因此如果资源使用完毕,记得及时手动释放资源。
资源分配状态分为“未分配”、“已分配”和“分配中”。
实例只有在停止状态下才能释放资源。停止实例后,点击右上角的“释放资源”,释放资源,停止计费。
已经释放资源的实例会进入“资源回收”,用户可以在“资源回收”里找到实例,并重新分配资源,进入计费状态。
磁盘扩容¶
实例只有在停止状态下才能磁盘扩容。停止实例后,在列表中点击磁盘扩容按钮,或是在实例详情中点击磁盘扩容按钮。
在弹出窗口中,通过滑条或是直接输入磁盘尺寸调整所需要的磁盘大小后,点击确定完成扩容。
注意
扩容大小在2048G范围内,实例自动扩容,无需其他额外操作,直接使用扩容空间。
扩容大小在2048G以上,需要按照以下教程操作。
扩容完成后,启动实例,进入到实例中。
在命令行输入lsblk
,查看磁盘扩容情况,本次扩容空间大小为20T,见下图:
在命令行继续输入df -Th
查看磁盘的格式,主要包含ext4或者xfs两种,本次实例查看见下图:
可以看到,lsblk
和df -Th
两个命令看到的磁盘大小是不一样的。用lsblk
看到的是20T,但是用df -Th
查看只有49G,两者存在差异。这是因为lsblk
查看的是block device,即逻辑磁盘大小。df
查看的是file system, 即文件系统层的磁盘大小。磁盘扩容后,block device容量变大,但还没有反映到file system中,需要用resize2fs 命令来更新。
在命令行输入resize2fs /dev/vda1
进行更新,扩容时间视扩容空间大小而定,扩容20T需要几分钟的时间,提示如下图所示内容,表示扩容完成。
在命令行输入df -Th
查看扩容后的磁盘空间,可以看到已经变为20T。
注意
resize2fs
只可用于调整ext4文件系统的大小。
如果分区类型为xfs,则执行xfs_growfs /dev/vda1
进行扩容,操作过程和ext4一样。
添加自定义服务¶
平台支持用户增加自定义服务,目前只支持自助添加和删除TCP端口映射。点击右上角的“添加自定义服务”。
在弹出窗口中输入服务名称,容器或虚拟机内部监听的服务地址,端口和所在节点。
注意
端口名称不可以跟保留的名称,即平台已使用的ssh, desktop, jupyter等重名。 用户也不可添加和删除spec里已经配的端口映射。