목록으로

Programming Notes

체크포인트/복원 워킹 그룹 출범 안내

쿠버네티스 커뮤니티는 관심사 특별 그룹(SIGs)과 워킹 그룹(WGs)을 통해 관심 있는 기여자들 간의 중요한 주제에 대한 논의를 촉진하고 있습니다. 오늘, 저희는 쿠버네티스에 체크포인트/복원 기능을 통합하는 데 초점을 맞춘 새로운 쿠버네티스 체크포인트 복원 WG 의 출범을...

쿠버네티스 커뮤니티는 관심사 특별 그룹(SIGs)과 워킹 그룹(WGs)을 통해 관심 있는 기여자들 간의 중요한 주제에 대한 논의를 촉진하고 있습니다. 오늘, 저희는 쿠버네티스에 체크포인트/복원 기능을 통합하는 데 초점을 맞춘 새로운 쿠버네티스 체크포인트 복원 WG의 출범을 알립니다.

동기 및 활용 사례

워킹 그룹에서 논의되는 몇 가지 주요 시나리오는 다음과 같습니다:

  • Jupyter 노트북 및 AI 챗봇과 같은 상호작용 워크로드의 리소스 활용 최적화
  • Java 애플리케이션 및 LLM 추론 서비스를 포함한, 초기화 시간이 긴 애플리케이션의 시작 가속화
  • 분산 모델 학습과 같은 장기 실행 워크로드의 내결함성을 위해 주기적인 체크포인팅 사용
  • 투명한 체크포인트/복원을 통해 중단 인식 스케줄링을 제공하여, 애플리케이션의 런타임 상태를 보존하면서 낮은 우선순위 Pod를 선점할 수 있도록 함
  • 워크로드 중단 없이 로드 밸런싱 및 유지보수를 위해 노드 간 Pod 마이그레이션 촉진.
  • 사이버 공격, 데이터 유출, 무단 접근과 같은 보안 사고를 조사하고 분석하기 위한 포렌식 체크포인팅 활성화.

이러한 시나리오 전반에 걸쳐, 목표는 쿠버네티스 커뮤니티와 성장하는 사용자 공간 체크포인트/복원(CRIU) 생태계 간의 아이디어 논의를 촉진하는 것입니다. CRIU 커뮤니티는 이러한 활용 사례를 지원하는 여러 프로젝트를 포함합니다:

  • CRIU - 실행 중인 애플리케이션 및 컨테이너를 체크포인트하고 복원하는 도구
  • checkpointctl - 컨테이너 체크포인트를 심층 분석하는 도구
  • criu-coordinator - CRIU를 사용하여 분산 애플리케이션의 협업 체크포인트/복원을 위한 도구
  • checkpoint-restore-operator - 체크포인트를 관리하기 위한 쿠버네티스 오퍼레이터

쿠버네티스와의 체크포인트/복원 통합에 대한 더 많은 정보는 여기에서 확인할 수 있습니다.

관련 행사

KubeCon EU 2025에서 투명 체크포인팅에 대한 저희의 발표에 이어, KubeCon + CloudNativeCon Europe 2026에서 열리는 패널 토론AI + ML 세션에 여러분을 환영하게 되어 기쁩니다.

저희와 소통하세요

쿠버네티스 또는 CRIU에 기여하는 데 관심이 있다면, 다음과 같은 방법으로 참여할 수 있습니다: