• 가상 면접 사례로 배우는 대규모 시스템 설계 기초 리뷰 :: 마이구미
    책 리뷰 2021. 9. 16. 22:05
    반응형
    이 글은 "가상 면접 사례로 배우는 대규모 시스템 설계 기초" 라는 책을 리뷰한다.
    본인은 백엔드 개발자가 아닌 프론트엔드 개발자이다.
    책 링크 - http://www.yes24.com/Product/Goods/102819435

     

     

    백엔드 개발자가 아니라 시스템 설계에 대한 지식은 많이 부족한 상태이다.

    그래도 관심은 항상 많고 학습을 열심히 하고 있다.

    그러던 중 이 책은 제목부터 흥미로웠다.

    가상 면접 사례로 배우는... 

     

    그리고...

    페이스북의 뉴스 피드를 설계하시오, 유튜브를 설계하시오, 구글 드라이브를 설계하시오 등과 같은 매혹적인 문장들이 있다.

    혹하지 않을 수 없다고 생각한다.

     

    실제로도 제목과 설명은 단순히 어그로가 아니였다.

    책의 내용의 흐름은 실제로 면접자과 면접관의 인터뷰 상황속에서 진행된다.

    상황의 진행은 4단계로 분류되어 흘러간다.

     

    • 1단계 - 문제 이해 및 설계 범위 확정
    • 2단계 - 개략적 설계안 제시 및 동의 구하기
    • 3단계 - 상세 설계
    • 4단계 - 마무리(추가로 논의할 만한 질문)

     

    위 4단계는 자연스럽게 연결되고 흥미로웠고 배울게 굉장히 많았다.

    오랜만에 정말 재밌게 읽은 책이다.

    대부분의 책은 목표 페이지를 정해놓고 여러번에 걸쳐 읽는다.

    이 책은 목표 페이지를 훨씬 넘겨버리는 일이 계속 발생했을 정도로 재밌게 술술 읽었다.

     

    디테일한 것까지는 이해할 수 없었으나, 어느 정도의 그림은 이해할 수 있을 정도로 잘 설명해주고 있다.

    대규모 시스템 설계를 할 기회는 흔치 않겠지만, 읽어보면 좋은 책이라고 생각한다.


     

    정말 많은 지식들이 있지만, 몇가지만 남겨보려한다.

     

    CAP 정리(브루어의 정리)

    CAP 는 다음으로 분류된다. 

     

    • 일관성(Consistency) - 모든 클라이언트는 언제나 같은 데이터를 봐야한다.
    • 가용성(Availability) - 클라이언트는 장애가 발생해도 항상 응답을 받을 수 있어야한다.
    • 파티션 감내(Partition tolerance) - 장애가 발생해도 시스템은 계속 동작해야한다.

     

    CAP 정리는 세 가지 요구사항을 만족하는 분산 시스템은 존재하지 않음을 증명한 정리이다.

    두 가지를 충족하려면 나머지 하나는 반드시 희생되는 것을 의미한다.

     

    세 가지 요구사항 가운데 두 가지를 만족하는 CP, AP, CA 시스템으로 분류된다.

    분산 시스템에서 파티션 감내는 피할 수 없기 때문에 실세계에서는 CP, AP 시스템만 존재한다.

     

    왜 일관성이나 가용성을 희생해야하는가? 예를 들면 다음과 같다.

     

    세 대의 복제 노드 n1, n2, n3 에 데이터를 복제하여 보관하는 상황이 있다.

    그 중 n3에 장애가 발생하여 n1, n2 와 통신할 수 없다.

    이러한 상황에서 n1, n2 에 전달 못한 n3 데이터가 존재한다면, n1와 n2 는 오래된 사본을 가지고 있다.

     

    가용성 대신 일관성을 선택한다면(CP 시스템) 데이터 불일치 피하기 위해 n1와 n2 에 쓰기 연산 중단해야한다.

    그렇게 되면 가용성 깨지게 된다. (데이터 일관성을 양보할 수 없는 시스템은 주로 은행권으로 볼 수 있다.)

     

    반대로 가용성을 선택한다면(AP 시스템), 읽기 및 쓰기 연산을 계속 허용해야해서 신선하지 못한 데이터를 반환할 위험은 있다.

     

    UUID

    uuid 는 고유 식별자로 일반적으로 우리가 사용하는 형태는 128bit 의 수로 32개의 문자와 4개의 하이픈으로 구성되어있다.

    ex) 400cafdc-9ea3-4eaf-9ea8-bab8e10dbce2

     

    기존에는 별 생각없이 사용하곤 했다.

    하지만 단점으로는 시간순으로 정렬할 수 없고, 64bit 이 요구사항이라면 맞지 않다.

    다른 접근 방향으로는 트위터 스노플레이크 접근법 존재한다.

     

    301 와 302 상태 코드의 차이

    두가지 모두 리디렉션 응답 상태 코드이다.

    주로 단축 URL 에서 사용될 수 있다.

     

    301 Permanently Moved - 리소스가 영구적으로 Location 헤더에 반환된 URL 로 이전되었다는 응답이다.

    302 Found - 리소스가 일시적으로 이동했다는 의미로 Location 헤더에 반환된 URL 에 의해 처리되어야 한다는 응답이다.

     

    301 상태 코드는 설명 그대로 "영구적" 으로 응답이 브라우저에 캐시된다.

    서버 부하를 줄일 수 있다.

    하지만 트래픽 분석이 필요하다면 캐시가 되지 않는 302 상태 코드를 써야한다.

     

    반응형

    댓글 4

Designed by Tistory.