본문 바로가기

CLOUD/Openshift

Redhat Openshift AI

반응형

 

Redhat Openshift AI란?

 

Red Hat OpenShift AI는 데이터 과학자 및 AI(인공 지능) 애플리케이션 개발자를 위한 플랫폼입니다. 완전히 지원되는 환경을 제공하므로 온프레미스 및/또는 퍼블릭 클라우드에서 머신러닝 모델을 신속하게 개발, 교육, 테스트 및 배포할 수 있습니다.

OpenShift AI는 Red Hat OpenShift용 관리형 클라우드 서비스 애드온 또는 온프레미스 또는 OpenShift의 퍼블릭 클라우드에 설치할 수 있는 자체 관리 소프트웨어로 제공됩니다.

 

출처:

https://www.redhat.com/en/technologies/cloud-computing/openshift/openshift-ai

 

Red Hat OpenShift AI

Red Hat® OpenShift® AI is an open source artificial intelligence and machine learning (AI/ML) platform for the hybrid cloud.

www.redhat.com

 

 

 

 

설치 방법

 

NFD Install

 

 

 

우선 어떤 node에 GPU가 있는지 찾기 위해 NFD(Node Feature Discovery) Operator를 설치합니다.

 

 

 

 

 

기본 설정으로 설치합니다.

 

 

 

 

 

Discovery 인스턴스 생성을 클릭

 

 

 

 

특성 조건이 없기 때문에 그대로 설치합니다.

 

 

 

 

사용준비 완료 된것을 확인합니다.

 

 

 

컴퓨팅 -> 노드 -> 확인하려는 노드 선택

 

 

 

 

라벨에 pci-10de.sriov.capable 이 있는지 확인합니다.

 

 

 

Dashboard Config

 

Exporter 적용

https://docs.nvidia.com/datacenter/cloud-native/openshift/latest/enable-gpu-monitoring-dashboard.html

 

 

 

 

모니터링 -> 대시보드 -> nvidia-dcgm-exporter-dashboard 에서 확인

 

 

 

NVIDIA GPU Operator Install

 

 

Nvidia Gpu Oerator 설치

 

 

 

 

ClusterPolicy 인스턴스 생성

 

 

 

 

 

기본구성으로 설치합니다.

 

 

 

 

ready 상태가 될때까지 기다립니다

 

 

 

GPU가 정상적으로 인식 되는지 확인

oc get nodes -o=custom-columns='Node:metadata.name,GPUs:status.capacity.nvidia\.com/gpu'

 

 

 

Redhat OpenShift AI 설치

 

 

 

Operator 설치

 

 

 

 

Ready 상태 확인

 

 

 

 

 

Openshift Console 우측 상단에 Red Hat OpenShift AI 클릭

 

 

 

 

Launch application 클릭

 

 

 

원하는 버전에 맞게 선택

 

 

 

 

완료 될때까지 기다립니다

 

 

 

 

Openshift AI를 사용할 준비를 마첬습니다.

 

 

 

참고문서:

https://access.redhat.com/documentation/en-us/red_hat_openshift_ai_self-managed/2-latest/html/installing_and_uninstalling_openshift_ai_self-managed/index

 

Installing and uninstalling OpenShift AI Self-Managed Red Hat OpenShift AI Self-Managed 2-latest | Red Hat Customer Portal

Install and uninstall OpenShift AI Self-Managed on your OpenShift Container Platform cluster.

access.redhat.com

 

 

 

 

반응형