Digital Transformation Nomad

Cloud의 시작-PC 서버에서 Data Center까지(1) 본문

Digital Transformation

Cloud의 시작-PC 서버에서 Data Center까지(1)

문학중년 2023. 1. 4. 17:16

  Digital Transformation을 준비하거나 수행하다 보면 Cloud라는 단어를 많이 보게 됩니다. Cloud를 활용해서 시스템을 구축한 사례도 있고, Data를 Cloud로 수집하여 AI 모델을 개발한 사례, 또는 Cloud를 통해서 일정을 단축하고 비용을 줄인 사례 등을 다양하게 볼 수 있습니다.

 

  하지만 Cloud의 개념과 종류, 특징에 대해서 정확하게 아는 사람들이 생각보다 많지 않습니다. Digital Transformation과 어떤 관계가 있는지? 꼭 필요한 개념인지? 어떤 경우에 활용하면 좋은지? 이러한 질문에 대해서 그동안의 경험치를 가지고 설명을 하려고 합니다.

 

  저 개인적으로는 Public Cloud를 접한 지 거의 10년 가까이 되어 갑니다. 과거에는 Cloud라는 용어 자체는 많이 들어봤지만 제대로 실체를 경험해본 사람들이 없었기 때문에, Cloud가 마케팅 용어냐? 거품 아니냐? 실체는 정말 있는가? 등등의 논란이 꽤 많았습니다.

 

  2013년 경에 AWS의 Cloud 컨퍼런스에 참석하면서 처음으로 제대로 된 설명을 들었던 기억이 있습니다. 지금은 많은 사람들이 Public Cloud에 대해서 인지를 하고 있고, 여러 기업에 도입되어 있지만, 당시에는 새로운 개념이었기 때문에 직관적으로 Public Cloud의 필요성과 운영방식에 대해서 바로 이해가 되지 않았고, On-premise 대비 장점이  명확하게 이해가 되지 않았습니다. 홈페이지 웹호스팅 하는 방식과 별로 다르지 않다라는 게 일반적인 인식이었습니다. 오히려 자체 Data Center를 보유하고 있는 IT 서비스 회사들의 경쟁사로만 인식이 되었습니다.

 

  그 후로 10년이 지났습니다. 지금은 그 때와 비교할 수 없는 많은 장점들이 있고, 실제로 활용 가능한 다양한 서비스가 생겼습니다. AWS뿐만 아니라 MS, Google, Oracle, Naver, NHN 등의 국내외 CSP(Cloud Service Provider)들이 다양한 서비스를 출시하면서 치열하게 경쟁하고 있습니다. 초창기에는 SI(System Integration) 회사들이 CSP를 적으로 여기면서 경계를 했으나 요즘은 많은 SI 회사들이 CSP의 파트너가 되어 Cloud 사업을 적극적으로 추진하고 있습니다.

 

  Cloud를 이해하려면 먼저 인프라 설치/운영의 기본이 되는 On-Premise에 대한 이해가 필요합니다. On-Premise는 고객사의 서버룸이나 데이터 센터에 직접 H/W와 S/W를 설치해서 운영하는 방식을 말합니다. 대부분의 기업들이 활용해왔던 방식입니다.

 

  과거에 Data Center가 제대로 없던 시절에는 PC서버나 Workstation을 사무실에 두고 Application을 운영했습니다. 일반 사무실에서 24시간 서버가 운영되다 보니 장애/파손/도난에 매우 취약했습니다. 서버가 열을 받는 경우도 많았고, 팬에 먼지가 쌓이기도 하고, 지나가는 사람 발에 전원선이나 네트워크 케이블이 걸려서 서버가 꺼지기도 하고, 네트워크가 끊기기도 합니다. 도난이나 파손 우려도 많아서 좀 더 안정적인 방법을 강구해야 했습니다.

 

  동일한 기능을 하는 서버를 두 대를 두고 이중화를 하는 경우도 있고, 시건 장치가 있는 박스에 서버를 보관하기도 했습니다. 그러다가 서버를 위한 별도의 공간이 필요하다는 인식이 확산되면서 사무실의 조그만 공간을 서버룸으로 만들기 시작합니다. 시건 장치도 달고, 서버들만 모아서 나름 운영 방식을 효율화합니다. 하지만 서버가 늘어날수록 공간이 비좁아지고, 네트워크 장비도 늘어나고, 전원선과 케이블도 복잡해집니다. 서버 하나 당 모니터와 키보드가 하나씩 배치가 되다 보니 공간이 더 필요했던 부분도 있었습니다.

 

  한 공간에서 수평적으로 서버를 늘리다가 공간의 제약의 제약이 있기 때문에, 좁은 공간을 효율화하기 위해서 서버와 네트워크 장비를 랙(rack)이라는 서랍장 같은 장비를 활용해서 아파트처럼 수직으로 쌓기 시작했습니다. 같은 랙에 있는 서버들을 하나의 모니터와 키보드/마우스로 작업이 가능하니 공간 효율성과 비용 효율성을 높이는데 큰 도움이 되었습니다. 바닥에는 네트워크와 전원 케이블을 깔고 그 위에 이중으로 바닥을 만들어서 랜공사와 전원공사 뿐만 아니라 유지보수가 효율적으로 진행되도록 하였습니다.

 

  하지만 랙에 서버들이 집적되고 랙이 증가하면서 서버 룸은 장비에서 발생된 열로 인해서 온도가 증가하게 됩니다. 서버룸은 매우 덥고 서버들의 팬 돌아가는 소음으로 꽉 차게 됩니다. 더운 여름에는 서버가 꺼지기도 합니다. 그래서 이러한 서버 과열을 방지하고자 에어컨을 설치해서 24시간 운영합니다. 에어컨은 전력 소모량이 많기 때문에 가끔 전력 과부하로 인해서 꺼지는 때도 있습니다. 그래서 전력 용량을 높이는 공사를 하기도 합니다. 당시에는 에어컨이 설치된 서버룸이 소음은 좀 나지만, 여름철에는 시원하기 때문에 땀 날 때 잠시 더위 식히기 좋은 곳이었습니다. 

 

NVIDIA DGX SuperPod

 

  Application이 운영되는 서버룸은 기업의 입장에서는 매우 중요한 곳입니다. H/W, S/W들이 제대로 운영되지 않으면 기업 업무가 마비되기 때문입니다. 그러다 보니 회계 감사를 받을 때 예전 없었던 전산 감사를 받게 되었습니다. 전산 감사 항목 중에 서버 관리 방식이 있었는데, 그 중 하나가 화재 예방 대책이었습니다. 물을 사용해서는 안되고, 서버에 영향을 주지 않도록 가스를 활용하는 시설을 갖춰야 했습니다.

 

  이와 관련하여 한때 CISA, CISSP라는 자격증이 유행했던 적이 있습니다. CISA는 'Certified Information System Auditor'의 약자로 '공인 정보보호 감사사'라고 불리며, CISSP는 'Certified Information System Security Professional'로 '공인 정보시스템 보안 전문가'인데 이러한 전산감사를 수행하는 인력들이 취득하는 자격증으로 알려졌습니다. 저도 당시 위의 두 자격증을 취득했었는데, 시험 내용 중에서 전산실의 재해 대응 관련된 내용이 있었습니다. CISA와 CISSP는 정보보안 자격증이긴 했는데, H/W, S/W 등이 운영되는 서버룸이나 Data Center는 매우 중요하게 다뤄졌던 기억이 납니다.

 

  하여튼, 개별 회사가 이러한 조건을 갖춘 서버룸을 구축/운용하기에 부담되니, 같은 빌딩에 입주한 회사들이 함께 각종 규정에 맞는 통합 서버룸을 갖추고 관제 인력을 상주시켜서 운영하게 됩니다. 전문 Data Center는 아니지만, 나름 시설과 인력을 갖추고 운영을 하다보니 이전과는 다르게 시너지 효과도 있고, 시스템을 좀 더 안정적으로 운영할 수 있는 장점이 있었습니다.

 

  그러다가 공간이라는 새로운 문제에 직면하게 됩니다. Application들이 증가하면 서버룸의 공간이 부족하게 됩니다. 초기 계획보다 많은 장비들이 들어오면서 전력 사용량도 증가하게 되다 보니, 전력 설비도 증설해야 하고, 그 서버들의 용량에 맞는 UPS도 증설해야 하게 됩니다. 사무용으로 설계/건축된 빌딩이다 보니 서버들을 설치/운영하는데 여러 가지 미흡한 부분들이 많았습니다. 제한된 공간 안에서 해결책을 찾기가 어렵다 보니 결국 이러한 이슈들을 해결하기 위해서 다른 방법을 모색하게 됩니다.

 

  첫 번째 방법은, 현재 운영 중인 모든 장비를 그대로 KT와 같은 Data Center로 이전하여 위탁 운영을 맡기는 방법입니다. 자산은 모두 고객사의 소유로 Data Center에는 상면비용, 관리비용, 관제비용 등을 지불하는 방식입니다. 초창기에 Public Cloud라는 개념이 혼란스러웠던 이유가 바로 이 방식과 구분이 잘 안 되었기 때문입니다.

  두 번째 방법은, Data Center를 직접 짓고 입주하는 방식입니다. 일정 규모 이상의 대기업 그룹들은 자사 Data Center를 많이 보유하고 있습니다. 그룹 네트워크, 보안, 서버 운영, Application 운영 등에서 시너지 효과를 얻을 수 있기 때문에 자체 Data Center를 가지고 있고, 복수의 Data Center를 보유한 곳도 많습니다.

 

  Data Center로 장비들을 다 이전하고 안전한 곳에서 전문가들의 서비스를 받으면서 잘 운영을 해왔습니다. 많은 사람들이 Data Center로 이전하면 모든 문제가 다 해결될 줄 알았습니다. 하지만 아직도 미흡한 부분이 있었는데, On-premise는 장비의 구매/설치 기간이 매우 길다는 점입니다.

 

  H/W와 S/W의 사양을 검토하고 발주를 하면 실제 장비가 납품되는데 시간이 많이 걸립니다. 장비가 도착하면 Data Center에 입고시키고 H/W를 조립/설치한 후에  S/W를 설치하게 됩니다. S/W를 설치한 후에 Application을 설치하고 이것 저것 테스트하다 보면 생각했던 시간보다 훨씬 더 오래 걸립니다. 최소 몇 개월은 소요되며, 22년 같은 반도체 대란 시에는 H/W의 납기만 1년 가까이 되기도 합니다.

 

  H/W를 구매할 때는 보통 4~5년 이상 사용할 계획을 하기 때문에 앞으로 발생할 트랜잭션의 증가를 예상하여 메모리, HDD, CPU 등을 좀 넉넉하게 구매하게 됩니다. 그러다 보니 계획했던 Peak에 도달하기 전까지는 H/W의 자원이 남아도는 현상이 발생합니다. H/W 제조사의 정책과 제품 정책상 매년 조금씩 사양을 업그레이드 하기 어렵기 때문에 어쩔 수 없이 처음에 구매할 때 좀 큰 H/W 스펙을 선택하게 됩니다.

 

  처음에 생각했던 용량보다 더 많은 트랜잭션이 생길 경우도 문제가 됩니다. 이때는 CPU, Memory, HDD 등을 증설해야 하는데, 보통 증설시 구매 단가가 더 비싸서 비용이 생각보다 많이 들기도 하고, 증설되는 H/W의 납기가 길 경우는 문제가 됩니다. 장비 증설 전까지는 느린 시스템을 사용해야 해서 사용자들의 불만이 엄청 빗발치기도 합니다.

 

  On-Prem 상에서 발생하는 이슈 중에서 긴 납기와 H/W, S/W 용량 예측의 부정확함으로 발생되는 내용에 대해서 간략히 정리를 했습니다. 위의 이야기는 직장 생활 초기부터 제가 직간접적으로 경험한 내용입니다. 다음 편에서 좀 더 설명드리겠습니다.

 

<제가 쓴 책 '넥스트 디지털'이 출간되었습니다. 블로그에 포스팅한 내용들이 자세하게 기술되어 있습니다>

 

 

넥스트 디지털 - 예스24

글로벌 리서치&자문 회사인 가트너가 선정한 한국 최초의 디지털 전환 글로벌 모범 사례 ‘AIDA’ 와 ‘HWADAP’ - 그 개발을 주도한 DT 담당 임원(CIO/CDO)이 알려주는 AI 시대 디지털 전환과 3가지 핵

www.yes24.com

 

 

<제 유튜브 채널 '정해진tv'입니다. 도움이 되시길 바랍니다>

 

 

Haejin Jeong TV

Digital Transformation에 관한 Contents를 소개하는 채널입니다. AI, Cloud, IoT, Blockchain 등의 신기술에 관한 내용을 소개하고자 합니다.

www.youtube.com