서버를 관리한다는 것
일반적으로 서버를 관리한다는 건 복잡하고 어려우며 고급 개발자들의 섬세한 작업이 필요한 영역입니다.
시간이 흐르면서 서버 환경이 계속 바뀌는데 CentOS에 익숙해지면 Ubuntu를 써야 하는 일이 생기고 AWS에 익숙해지면 Azure를 써야 하는 일이 생깁니다. Chef의 cookbook에 익숙해지면 Ansible의 playbook을 작성해야 하는 일이 생깁니다.
DevOps의 등장으로 개발 주기가 짧아지면서 배포는 더 자주 이루어지고, 마이크로 서비스 아키텍처가 유행하면서 프로그램은 더 잘게 쪼개어져 관리는 더 복잡해져 갑니다.
새로운 툴은 계속해서 나오고 클라우드의 발전으로 설치해야 할 서버가 수 백, 수 천대에 이르는 1 나누기 0 같은 상황에서 도커가 등장하고 서버 관리 방식이 완전히 바뀌게 됩니다.
도커의 역사
도커는 2013년 3월 산타클라라에서 열린 Pycon Conference에서 dotCloud의 창업자인 Solomon Hykes가 The future of Linux Container라는 세션을 발표하면서 처음 세상에 알려졌습니다.
이 발표 이후 도커가 인기를 얻으면서 2013년 10월 아예 회사 이름을 도커로 바꾸고 2014년 6월 도커 1.0을 발표합니다.
2014년 8월 도커에 집중하기 위해 dotCloud 플랫폼을 매각하고 2015년 4월 $95M(약 1,100억 원) 투자를 유치한 후 계속해서 빠르게 성장하고 있습니다.
도커에서 한 2016년 설문조사에서 90%가 개발에 사용 중이고 80%가 DevOps에 사용할 예정이며 58%가 운영 환경에서 사용 중이라고 합니다. 2014년 도커 서울 밋업을 시작할 때만 해도 대부분의 사람들이 도커를 잘 모르고 개념도 이해하지 못했는데 이제는 거의 모르는 사람이 없을 정도로 널리 쓰이고 있습니다.
도커란?
도커는 컨테이너 기반의 오픈소스 가상화 플랫폼입니다.
컨테이너라 하면 배에 실는 네모난 화물 수송용 박스를 생각할 수 있는데 각각의 컨테이너 안에 있는 옷, 신발, 전자제품 등 다양한 화물을 넣을 수 있고 규격화되어 컨테이너선이나 트레일러 등 다양한 운송 수단으로 쉽게 옮길 수 있습니다.
서버에서 이야기하는 컨테이너도 이와 비슷한데 다양한 프로그램, 실행환경을 컨테이너로 추상화하고 동일한 인터페이스를 제공하여 프로그램의 배포 및 관리를 단순하게 해 줍니다.
백엔드 프로그램, 데이터베이스 서버, 메시지 큐 등 어떤 프로그램도 컨테이너로 추상화할 수 있고 조립 PC, AWS, Azure, Google Cloud 등 어디에서든 실행할 수 있습니다.
컨테이너를 가장 잘 사용하고 있는 기업은 구글인데 2014년 발표에 따르면 구글은 모든 서비스들이 컨테이너로 동작하고 매주 20억 개의 컨테이너를 구동한다고 합니다.
컨테이너(Container)
컨테이너는 격리된 공간에서 프로세스가 동작하는 기술입니다. 가상화 기술의 하나지만 기존 방식과는 차이가 있습니다.
기존의 가상화 방식은 주로 OS 가상화였습니다.
우리에게 익숙한 VMware나 VirtualBox 같은 가상 머신은 호스트 OS 위에 게스트 OS 전체를 가상화하여 사용하는 방식입니다.
이 방식은 여러 가지 OS를 가상화할 수 있고 비교적 사용법이 간단하지만 무겁고 느려서 운영 환경에선 사용할 수 없었습니다.
이러한 상황을 개선하기 위해 CPU의 가상화 기술(HVM)을 이용한 KVM과 반가상화 방식의 Xen이 등장합니다.
이러한 방식은 게스트 OS가 필요하긴 하지만 전체 OS를 가상화하는 방식이 아니었기 때문에 호스트형 가상화 방식에 비해 성능이 향상되었습니다. 이러한 기술들은 OpenStack이나 AWS, Rackspace 같은 클라우드 서비스에서 가상 컴퓨팅 기술의 기반이 되었습니다.
전가상화든 반가상화든 추가적인 OS를 설치하여 가상화하는 방법은 어쨌든 성능 문제가 있었고 이를 개선하기 위해 프로세스를 격리하는 방식이 등장합니다.
리눅스에서는 이 방식을 리눅스 컨테이너라고 하고 단순히 프로세스를 격리시키기 때문에 가볍고 빠르게 동작합니다.
CPU나 메모리는 딱 프로세스가 필요한 만큼만 추가로 사용하고 성능적으로도 거의 손실이 없습니다.
도커의 기본 네트워크 모드는 Birdge 모드로 약간의 성능 손실이 있습니다.
네트워크 성능이 중요한 프로그램의 경우 --net=host 옵션을 고려해야 합니다.
하나의 서버에 여러 개의 컨테이너를 실행하면 서로 영향을 미치지 않고 독립적으로 실행되어 마치 가벼운 VM을 사용하는 느낌을 줍니다.
실행 중인 컨테이너에 접속하여 명령어를 입력할 수 있고 apt-get이나 yum으로 패키지를 설치할 수 있으며 사용자도 추가하고 여러 개의 프로세스를 백그라운드로 실행할 수 있습니다. CPU나 메모리 사용량을 제한할 수 있고 호스트의 특정 포트와 연결하거나 호스트의 특정 디렉터리를 내부 디렉터리인 것처럼 사용할 수도 있습니다.
새로운 컨테이너를 만드는 데 걸리는 시간은 겨우 1-2초로 가상 머신과 비교도 할 수 없이 빠릅니다.
이러한 컨테이너라는 개념은 도커가 처음 만든 것이 아닙니다. 도커가 등장하기 이전에, 프로세스를 격리하는 방법으로 리눅스에서는 cgroups와 namespace를 이용한 LXC가 있었고 FreeBSD에선 Jail, Solaris Zones라는 기술이 있었습니다. 구글에서는 고급 기술자들이 직접 컨테이너 기술을 만들어 사용하였고 Imctfy라는 오픈 소스 컨테이너 기술을 공개했지만 성공하진 못했습니다.
도커는 LXC를 기반으로 시작해서 0.9 버전에서는 자체적인 libcontainer기술을 가용하였고 추후 runC 기술에 합쳐졌습니다.
이미지(Image)
도커에서 가장 중요한 개념은 컨테이너와 함께 이미지라는 개념입니다.
이미지는 컨테이너 실행에 필요한 파일과 설정값 등을 포함하고 있는 것으로 상태 값을 가지지 않고 변하지 않습니다.(Immutable)
컨테이너는 이미지를 실행한 상태라고 볼 수 있고 추가되거나 변하는 값은 컨테이너에 저장됩니다.
같은 이미지에서 여러 개의 컨테이너를 생성할 수 있고 컨테이너의 상태가 바뀌거나 컨테이너가 삭제되더라도 이미지는 변하지 않고 그대로 남아 있습니다.
ubuntu 이미지는 ubuntu를 실행하기 위한 모든 파일을 가지고 있고 MySQL 이미지는 debian을 기반으로 MySQL을 실행하는데 필요한 파일과 실행 명령어, 포트 정보 등을 가지고 있습니다.
좀 더 복잡한 예로 Gitlab 이미지는 CentOS를 기반으로 ruby, go, database, redis, gitlab source, nginx 등을 가지고 있습니다.
말 그대로 이미지는 컨테이너를 실행하기 위한 모든 정보를 가지고 있기 때문에 더 이상 의존성 파일을 컴파일하고 이것저것 설치할 필요가 없습니다. 이제 새로운 서버가 추가되면 미리 만들어 놓은 이미지를 다운로드하고 컨테이너를 생성만 하면 됩니다. 한 서버에 여러 개의 컨테이너를 실행할 수 있고 수십, 수백, 수천 대의 서버도 문제없습니다.
도커 이미지는 Docker hub에 등록하거나 Docker Registry 저장소를 직접 만들어 관리할 수 있습니다.
현재 공개된 도커 이미지는 50만 개가 넘고 Docker hub의 이미지 다운로드 수는 80억 회에 이릅니다.
누구나 쉽게 이미지를 만들고 배포할 수 있습니다.
왜 이렇게 핫한가?
도커는 완전히 새로운 기술이 아니며 이미 존재하는 기술을 잘 포장했다고 볼 수 있습니다.
컨테이너, 오버레이 네트워크, 유니온 파일 시스템 등 이미 존재하는 기술을 도커처럼 잘 조합하고 사용하기 쉽게 만든 것은 없었고 사용자들이 원하는 기능을 간단하지만 획기적인 아이디어로 구현하였습니다.
레이어 저장 방식
도커 이미지는 컨테이너를 실행하기 위한 모든 정보를 가지고 있기 때문에 보통 용량이 수백 MB에 이릅니다.
처음 이미지를 다운로드할 땐 크게 부담이 안되지만 기존 이미지에 파일 하나 추가했다고 수백 MB를 다시 다운로드한다면 매우 비효율적일 수밖에 없습니다.
도커는 이러한 문제를 해결하기 위해 레이어(Layer)라는 개념을 사용하고 유니온 파일 시스템을 이용하여 여러 개의 레이어를 하나의 파일 시스템으로 사용할 수 있게 해 줍니다. 이미지는 여러 개의 읽기 전용 레이어로 구성되고 파일이 추가되거나 수정되면 새로운 레이어가 생성됩니다. ubuntu 이미지가 A + B + C의 집합이라면 ubuntu 이미지를 베이스로 만든 nginx 이미지는 A + B + C + nginx 가 됩니다. webapp 이미지를 nginx 이미지 기반으로 만들었다면 예상대로 A + B + C + nginx + source 레이어로 구성됩니다.
webapp 소스를 수정하면 A, B, C, nginx 레이어를 제외한 새로운 source(v2) 레이어만 다운로드하면 되기 때문에 굉장히 효율적으로 이미지를 관리할 수 있습니다.
컨테이너를 생성할 때도 레이어 방식을 사용하는데 기존의 이미지 레이어 위에 읽기/쓰기 레이어를 추가합니다.
이미지 레이어를 그대로 사용하면서 컨테이너가 실행 중에 생성하는 파일이나 변경된 내용은 읽기/쓰기 레이어에 저장되므로 여러 개의 컨테이너를 생성해도 최소한의 용량만 사용합니다.
가상화의 특성상 이미지 용량이 크고 여러 대의 서버에 배포하는 걸 감안하면 단순하지만 엄청나게 영리한 설계입니다.
이미지 경로
이미지는 Url 방식으로 관리하며 태그를 붙일 수 있습니다.
ubuntu 14.04 이미지는 docker.io/library/ubuntu:14.04 또는docker.io/library/ubuntu:trustry이고 docker.io/library는 생략 가능하여 ubuntu:14.04로 사용할 수 있습니다. 이러한 방식은 이해하기 쉽고 편리하게 사용할 수 있으며 태그 기능을 잘 이용하면 테스트나 롤백도 쉽게 할 수 있습니다.
Dockerfile
# vertx/vertx3 debian version
FROM subicura/vertx3:3.3.1
MAINTAINER chungsub.kim@purpleworks.co.kr
ADD build/distributions/app-3.3.1.tar /
ADD config.template.json /app-3.3.1/bin/config.json
ADD docker/script/start.sh /usr/local/bin/
RUN ln -s /usr/local/bin/start.sh /start.sh
EXPOSE 8080
EXPOSE 7000
CMD ["start.sh"]
도커는 이미지를 만들기 위해 Dockerfile이라는 파일 자체 DSL(Domain-specifix language) 언어를 이용하여 이미지 생성 과정을 적습니다. 추후에 문법에 대해 자세히 다루겠지만 위 샘플을 보면 그렇게 복잡하지 않다는 걸 알 수 있습니다.
이것은 굉장히 간단하지만 유용한 아이디어인데, 서버에 어떤 프로그램을 설치하려고 이것저것 의존성 패키지를 설치하고 설정 파일을 만들었던 경험이 있다면 더 이상 그 과정을 블로깅하거나 메모장에 적지 말고 Dockerfile로 관리하면 됩니다.
이 파일은 소스와 함께 버전 관리되고 원한다면 누구나 이미지 생성 과정을 보고 수정할 수 있습니다.
Docker Hub
도커 이미지의 용량은 보통 수백 MB로 수 GB가 넘는 경우도 흔합니다. 이렇게 큰 용량의 이미지를 서버에 저장하고 관리하는 것은 쉽지 않은데 도커는 Docker Hub를 통해 공개 이미지를 무료로 관리해 줍니다. 하루에도 엄청난 용량의 이미지가 전 세계에서 다운로드되고 트래픽 비용만 해도 어마어마할 것 같은데 그것이 다 무료!!입니다.
Command와 API
도커 클라이언트의 커맨드 명령어는 정말 잘 만들어져 있습니다. 대부분의 명령어는 직관적이고 사용하기 쉬우며 컨테이너의 복잡한 시스템 구성을 이해하지 못하더라도 편하게 사용할 수 있습니다. 또한 http 기반의 REST API도 지원하여 확장성이 굉장히 좋고 훌륭한 3rd party 툴이 나오기 좋은 환경입니다.
'BackEnd > Devops' 카테고리의 다른 글
자주 사용하는 LINUX 명령어 (0) | 2022.11.03 |
---|