목록서비스모니터링 (6)
Zero To One
Achievement Goals 시스템의 가용성과 확장성을 평가할 수 있다. 부하 테스트의 목적을 이해할 수 있다. Throughput과 Latency의 개념을 이해할 수 있다. 시스템의 병목이 발생하는 주요 원인과 대책을 이해할 수 있다. SLO를 설정하고, 이를 기반으로 부하 테스트를 진행하고, 달성 여부를 파악할 수 있다. 가용성과 확장성 평가 가용성과 확장성 Review 첫번째 유닛에서부터 가용성과 확장성을 염두하여 시스템을 설계하는 것의 중요성을 강조했습니다. 또한 다수의 노드를 가진 분산 시스템, 또한 서버리스 아키텍처 등을 통해 가용성과 확장성을 확보할 수 있다는 점 역시 배웠습니다. 다시 한번 정리를 하면 다음과 같습니다. 가용성 가용성(Availability)이란 시스템이 정상적으로 사용..
SLI, SLO, SLA란? SLI(서비스 수준 표시기,Service Level Indicator): 일정 기간 동안의 측정항목 및 대상 값(범위) SLO(서비스 수준 목표,Service Level Objective): SLA 목표를 나타내는 모든 SLI SLA(서비스 수준 계약,Service Level Agreement): SLO에 대한 법적 계약(예: 측정 방법, 알림, 서비스 크레딧 등) 서비스나 시스템에 있어 중요한 지표를 판단하는 근거 사용자가 직접 대면하는 시스템 보통 프론트엔드에 해당하며, 이 경우 가용성, 응답 시간, 처리량 이 중요. 저장소 시스템 응답 시간, 가용성, 내구성 이 중요. 빅데이터 시스템 데이터 파이프라인이 이에 해당하며, 처리량, 그리고 엔드포인트 간 응답 시간 이 중요...
> sudo kubectl port-forward service/ingress-nginx-controller 80 The connection to the server localhost:8080 was refused - did you specify the right host or port? https://kubernetes.io/docs/tasks/extend-kubernetes/http-proxy-access-api/ Use an HTTP Proxy to Access the Kubernetes API This page shows how to use an HTTP proxy to access the Kubernetes API. Before you begin You need to have a Kubernet..
https://sre.google/sre-book/monitoring-distributed-systems/#xref_monitoring_golden-signals Google - Site Reliability Engineering Monitoring Distributed Systems Written by Rob EwaschukEdited by Betsy Beyer Google’s SRE teams have some basic principles and best practices for building successful monitoring and alerting systems. This chapter offers guidelines for what issues should in sre.google SRE..
Error: INSTALLATION FAILED: rendered manifests contain a resource that already exists. Unable to continue with install: IngressClass "nginx" in namespace "" exists and cannot be imported into the current release: invalid ownership metadata; label validation error: missing key "app.kubernetes.io/managed-by": must be set to "Helm"; annotation validation error: missing key "meta.helm.sh/release-nam..
1. 디스코드 웹훅 url 준비 2. 람다 설정 (런타임 : 파이썬 3.7) 및 SNS를 람다의 트리거로 설정 import boto3 import json import logging import os from base64 import b64decode from urllib.request import Request, urlopen from urllib.error import URLError, HTTPError HOOK_URL = '웹훅 url 주소' logger = logging.getLogger() logger.setLevel(logging.INFO) def lambda_handler(event, context): logger.info("Event: " + str(event)) message = json..