Tuần 1: Giới thiệu về Karpenter và Cài đặt

Ngày 1:
- Lý thuyết: Giới thiệu về Kubernetes và quản lý cluster, vai trò của Karpenter, cài đặt và cấu hình cơ bản.
- Thực hành:
  1. Cài đặt Karpenter trên một cluster Kubernetes cục bộ (ví dụ: Minikube hoặc kind).
  2. Tạo một Provisioner đơn giản để cấp phát một node worker.
  3. Kiểm tra node worker mới được tạo bằng kubectl get nodes.
Ngày 2:
- Lý thuyết: Các khái niệm chính (Nodes, Capacities, Constraints), các loại workload, Karpenter Internals.
- Thực hành:
  1. Tạo một Provisioner với các ràng buộc (constraints) cụ thể (ví dụ: loại instance, vùng sẵn sàng).
  2. Triển khai một ứng dụng mẫu (ví dụ: nginx) và quan sát Karpenter tự động cấp phát node để đáp ứng nhu cầu.
  3. Sử dụng kubectl describe node để kiểm tra chi tiết về node được Karpenter cấp phát.
Ngày 3:
- Lý thuyết: Cài đặt Karpenter nâng cao, Custom Resources, tùy chỉnh Karpenter.
- Thực hành:
  1. Tạo một Node Template tùy chỉnh để định nghĩa các thông số của node (ví dụ: AMI, loại instance, tags).
  2. Sử dụng Provisioner Presets để tạo các cấu hình Provisioner có thể tái sử dụng.
  3. Thử nghiệm với các chiến lược cấp phát node động khác nhau (ví dụ: cấp phát node theo lịch trình).

Tuần 2: Quản lý Cluster với Karpenter

Ngày 4:
- Lý thuyết: Tùy chọn tạo cluster, tính năng tự động triển khai, các chiến lược triển khai.
- Thực hành:
  1. Tạo một cluster mới sử dụng Karpenter để quản lý node.
  2. Triển khai một ứng dụng có khả năng mở rộng và quan sát Karpenter tự động điều chỉnh số lượng node.
  3. Thử nghiệm các chiến lược triển khai khác nhau (ví dụ: rolling update, blue-green deployment).
Ngày 5:
- Lý thuyết: Quản lý mở rộng node, cân bằng tải, tối ưu hóa hiệu suất.
- Thực hành:
  1. Sử dụng Karpenter để mở rộng node theo chiều ngang (horizontal scaling) để đáp ứng lưu lượng truy cập tăng đột biến.
  2. Cấu hình Karpenter để sử dụng các tính năng cân bằng tải của cloud provider (ví dụ: Elastic Load Balancing của AWS).
  3. Thử nghiệm các tham số khác nhau của Karpenter để tối ưu hóa hiệu suất cluster.
Ngày 6:
- Lý thuyết: Giám sát cluster, cài đặt nâng cao, bảo mật Karpenter.
- Thực hành:
  1. Cài đặt và cấu hình Prometheus và Grafana để giám sát cluster Karpenter.
  2. Triển khai Karpenter trong một môi trường multi-cluster.
  3. Cấu hình Karpenter để sử dụng IAM roles và network policies để tăng cường bảo mật.

Tuần 3: Phát triển Ứng dụng với Karpenter

Ngày 7:
- Lý thuyết: Triển khai ứng dụng, sử dụng Kubernetes manifests.
- Thực hành:
  1. Viết một Kubernetes Deployment manifest để triển khai một ứng dụng web đơn giản trên cluster Karpenter.
  2. Sử dụng Kubernetes Service để expose ứng dụng ra bên ngoài.
  3. Sử dụng Kubernetes Ingress để định tuyến traffic đến ứng dụng.
Ngày 8:
- Lý thuyết: Quản lý vòng đời ứng dụng, quản lý tài nguyên, giám sát ứng dụng.
- Thực hành:
  1. Cập nhật ứng dụng web bằng cách thay đổi phiên bản image trong Deployment manifest.
  2. Sử dụng Kubernetes Horizontal Pod Autoscaler (HPA) để tự động mở rộng ứng dụng dựa trên CPU hoặc memory usage.
  3. Sử dụng Kubernetes metrics server để thu thập thông tin về tài nguyên ứng dụng.
Ngày 9:
- Lý thuyết: Thực hành triển khai ứng dụng, kỹ thuật nâng cao, tối ưu hóa chi phí.
- Thực hành:
  1. Triển khai một ứng dụng phức tạp hơn (ví dụ: ứng dụng microservices) trên Karpenter.
  2. Sử dụng taints và tolerations để kiểm soát vị trí triển khai của pod.
  3. Sử dụng spot instances để giảm chi phí chạy ứng dụng trên Karpenter.

Tuần 4: Bảo mật, Độ tin cậy và Triển khai Liên tục

Ngày 10:
- Lý thuyết: Các biện pháp bảo mật, quản lý truy cập và phân quyền.
- Thực hành:
  1. Thiết lập RBAC (Role-Based Access Control) để kiểm soát quyền truy cập vào các tài nguyên Karpenter.
  2. Sử dụng Pod Security Policies (hoặc Pod Security Standards) để hạn chế các hành động mà pod có thể thực hiện.
  3. Kiểm tra tính an toàn của cluster Karpenter bằng cách sử dụng các công cụ như kube-bench hoặc Trivy.
Ngày 11:
- Lý thuyết: Thiết lập tính sẵn sàng cao, sao lưu và phục hồi, quản lý lỗi.
- Thực hành:
  1. Triển khai Karpenter trong một cấu hình multi-AZ (Availability Zone) để đảm bảo tính sẵn sàng cao.
  2. Tạo bản sao lưu của các Provisioner, Node Template và các CRD khác của Karpenter.
  3. Thử nghiệm các kịch bản lỗi khác nhau (ví dụ: mất node) và quan sát cách Karpenter tự động phục hồi.
Ngày 12:
- Lý thuyết: Triển khai liên tục, quản lý phiên bản, tích hợp liên tục.
- Thực hành:
  1. Thiết lập một pipeline CI/CD đơn giản sử dụng Jenkins hoặc GitLab CI để tự động triển khai ứng dụng lên cluster Karpenter.
  2. Sử dụng Helm hoặc Kustomize để quản lý phiên bản và cấu hình của ứng dụng.
  3. Tích hợp các công cụ kiểm tra (ví dụ: SonarQube) vào pipeline CI/CD để đảm bảo chất lượng ứng dụng.

Ngày 13:

Sáng: Tìm hiểu sâu hơn về Karpenter Internals:
- Đọc tài liệu chính thức của Karpenter về kiến trúc và các thành phần của nó.
- Tìm hiểu về các vòng lặp điều tiết (reconciliation loops) và cách Karpenter đưa ra quyết định cấp phát node.
Chiều: Thực hành với Karpenter Internals:
- Sử dụng kubectl get events để quan sát các sự kiện liên quan đến Karpenter.
- Sử dụng kubectl describe provisioner và kubectl describe node để kiểm tra chi tiết về các Provisioner và node được Karpenter quản lý.
- Thử nghiệm với các tham số khác nhau của Karpenter (ví dụ: ttlSecondsAfterEmpty) để xem chúng ảnh hưởng như thế nào đến quá trình cấp phát node.

Ngày 14:

Sáng: Tiếp tục tìm hiểu về Karpenter Internals:
- Đọc các bài viết blog và bài thuyết trình về Karpenter để hiểu rõ hơn về cách nó hoạt động.
- Tham gia vào cộng đồng Karpenter (ví dụ: Slack channel, GitHub Discussions) để đặt câu hỏi và trao đổi kinh nghiệm với những người khác.
Chiều: Thực hành nâng cao với Karpenter Internals:
- Viết một Provisioner tùy chỉnh để triển khai một loại node cụ thể (ví dụ: node GPU).
- Sử dụng các công cụ như kubectl logs và kubectl exec để gỡ lỗi các vấn đề liên quan đến Karpenter.

Ngày 15:

Sáng: Benchmark hiệu suất Karpenter:
- Chuẩn bị một môi trường thử nghiệm với một cluster Kubernetes và Karpenter.
- Cài đặt và cấu hình Prometheus và Grafana để thu thập và hiển thị dữ liệu.
Chiều: Thực hiện benchmark hiệu suất:
- Sử dụng một công cụ benchmark như kube-burner hoặc clusterloader2 để tạo ra tải cho cluster.
- So sánh hiệu suất của Karpenter với Cluster Autoscaler (hoặc một công cụ autoscaling khác) bằng cách đo các chỉ số như thời gian cấp phát node, độ trễ của ứng dụng, và chi phí.

Ngày 16:

Sáng: Phân tích kết quả benchmark:
- Phân tích dữ liệu thu thập được từ Prometheus và Grafana để đánh giá hiệu suất của Karpenter.
- So sánh kết quả benchmark của Karpenter với các công cụ autoscaling khác.
Chiều: Tối ưu hóa hiệu suất Karpenter:
- Dựa trên kết quả benchmark, điều chỉnh các tham số của Karpenter để cải thiện hiệu suất.
- Thử nghiệm các cấu hình khác nhau của Karpenter để tìm ra cấu hình tối ưu cho môi trường của bạn.

Tuần 5

Ngày 17:

Sáng: Nâng cấp cluster Karpenter:
- Lập kế hoạch nâng cấp cluster Karpenter, bao gồm các bước cần thiết và các rủi ro tiềm ẩn.
- Chuẩn bị một môi trường staging để kiểm tra quá trình nâng cấp trước khi áp dụng cho môi trường production.
Chiều: Thực hiện nâng cấp cluster:
- Nâng cấp Karpenter lên phiên bản mới nhất.
- Kiểm tra các ứng dụng và dịch vụ trên cluster để đảm bảo chúng vẫn hoạt động bình thường sau khi nâng cấp.

Ngày 18:

Sáng: Di chuyển workload giữa các node:
- Lập kế hoạch di chuyển workload giữa các node, bao gồm các bước cần thiết và các rủi ro tiềm ẩn.
- Sử dụng các công cụ như kubectl drain và kubectl cordon để di chuyển pod giữa các node một cách an toàn.
Chiều: Thực hiện di chuyển workload:
- Di chuyển các pod giữa các node theo kế hoạch.
- Kiểm tra các ứng dụng và dịch vụ trên cluster để đảm bảo chúng vẫn hoạt động bình thường sau khi di chuyển workload.

Ngày 19:

Sáng: Giám sát và logging nâng cao:
- Cài đặt và cấu hình các công cụ giám sát và logging nâng cao như Elasticsearch, Fluentd, và Kibana (EFK stack).
- Tạo các dashboard và cảnh báo để theo dõi hoạt động của cluster Karpenter và các ứng dụng trên đó.
Chiều: Thực hiện chaos engineering:
- Sử dụng một công cụ chaos engineering như Chaos Mesh hoặc LitmusChaos để mô phỏng các sự cố trong cluster Karpenter (ví dụ: mất node, mất kết nối mạng).
- Quan sát cách Karpenter và các ứng dụng phản ứng với các sự cố và thực hiện các điều chỉnh cần thiết để cải thiện khả năng phục hồi của hệ thống.

Ngày 20:

Sáng: Xây dựng kế hoạch disaster recovery:
- Xác định các rủi ro tiềm ẩn đối với cluster Karpenter (ví dụ: mất dữ liệu, mất kết nối mạng).
- Lập kế hoạch chi tiết để phục hồi cluster trong trường hợp xảy ra sự cố, bao gồm các bước cụ thể và thời gian ước tính.
Chiều: Xây dựng pipeline CI/CD phức tạp:
- Thiết kế một pipeline CI/CD phức tạp hơn, bao gồm các giai đoạn như kiểm tra tĩnh, kiểm tra đơn vị, kiểm tra tích hợp, và triển khai.
- Sử dụng các công cụ như Jenkins, GitLab CI, hoặc GitHub Actions để tự động hóa pipeline.
- Tích hợp Karpenter vào pipeline để tự động cấp phát node và triển khai ứng dụng.

20 ngày Kapenter

Table of contents

Tuần 1: Giới thiệu về Karpenter và Cài đặt

Tuần 2: Quản lý Cluster với Karpenter

Tuần 3: Phát triển Ứng dụng với Karpenter

Tuần 4: Bảo mật, Độ tin cậy và Triển khai Liên tục

Tuần 5