运行MPI作业
本指南介绍将介绍如何设置MPI Operator,以及如何使用YuniKorn调度程序运行MPIJob。
安装MPI操作器
您可以使用以下命令安装MPI操作器。如果您在安装时遇到问题,请参阅此文档了解详细信息。
kubectl create -f https://raw.githubusercontent.com/kubeflow/mpi-operator/master/deploy/v2beta1/mpi-operator.yaml
运行MPI作业
此示例显示如何运行MPI应用程序。
此程序将印出一些关于workers的基础信息,然后计算圆周率的近似值。
这是一个计算圆周率的YAML示例:
apiVersion: kubeflow.org/v2beta1
kind: MPIJob
metadata:
name: pi
spec:
slotsPerWorker: 1
runPolicy:
cleanPodPolicy: Running
ttlSecondsAfterFinished: 60
sshAuthMountPath: /home/mpiuser/.ssh
mpiReplicaSpecs:
Launcher:
replicas: 1
template:
labels:
applicationId: "mpi_job_pi"
queue: root.mpi
spec:
schedulerName: yunikorn
containers:
- image: mpioperator/mpi-pi
name: mpi-launcher
securityContext:
runAsUser: 1000
command:
- mpirun
args:
- -n
- "2"
- /home/mpiuser/pi
resources:
limits:
cpu: 1
memory: 1Gi
Worker:
replicas: 2
template:
labels:
applicationId: "mpi_job_pi"
queue: root.mpi
spec:
schedulerName: yunikorn
containers:
- image: mpioperator/mpi-pi
name: mpi-worker
securityContext:
runAsUser: 1000
command:
- /usr/sbin/sshd
args:
- -De
- -f
- /home/mpiuser/.sshd_config
resources:
limits:
cpu: 1
memory: 1Gi
创建一个MPIJob。
kubectl create -f deployments/examples/mpioperator/Pi/pi.yaml
我们在圆周率示例中添加了Yunikorn标签,以演示如何使用yunikorn调度程序。