반응형

클라우드 컴퓨팅

  • 클라우드 컴퓨팅
    • 자신의 컴퓨터가 아닌 인터넷으로 연결된 다른 컴퓨터로 정보를 처리하는 기술
    • 1960년대 미국의 존 메카시가 "컴퓨팅 환경은 공공 시설을 쓰는 것 과도 같을 것" 이라고 개념을 제시
    • 구글 연구원 크리스토프 비스글리아가 최초 고안
  • 클라우드 컴퓨팅 특징
    • 여러 IT 기기를  통해 언제 어디서든 정보를 이용 가능
    • 컴퓨팅 자원을 피룡한 만큼 빌려쓰고 사용요금을 지급하는 방식
    • 빅데이터 구축, 디바이스의 연산 용량 한계를 극복하기 위해 시작
    • 인터넷 상의 서버를 통해 IT 관련 서비스를 한번에 사용할 수 있는 컴퓨팅 환경
    • 정보가 인터넷상 서버에서는 영구적으로 저장됨
  • 클라우드 컴퓨팅의 장점
    • 초기구입 비용 적음
    • 웹을 실행할 사양이면 충분하게 사용 가능
    • 휴대성 높음
    • 가상화 기술과 분산 컴퓨팅 기술로 서버의 자원을 묶거나 분할하여 필요할 때 사용 하므로 컴퓨터 가용율이 높다.
  • 클라우드 컴퓨팅의 단점
    • 서버가 공격당하면 개인정보 유출 위험
    • 재해에 서버의 데이터가 손상되면, 백업 하지 않으면 정보를 되살리지 못한다.
    • 사용자가 원하는 애플리케이션을 설치하는 데에 제약이 있음
    • 통신환경이 열악하면 서비스 받기 힘듬
  • 클라우드 스토리지 서비스
    • 데이터 아카이브(보관) 및 백업(보호), 파일 서버, 재해 대책 등의 용도로 이용되는 서비스
    • AWS
    • 어려 개의 데이터 센터에 데이터를 분산 저장함으로써 데이터 손실을 막음
  • 클라우드 기반 하드웨어 보안 모듈
    • 클라우드(데이터센터) 기반으로 암호화 키 생성, 저장, 처리 등을 제공하는 정보보안 서비스
  • 그리드 컴퓨팅
    • 모든 컴퓨팅 기기를 하나의 초고속 네트워크로 연결하여, 컴퓨터의 계산능력을 극대화한 차세대 디지털 신경망 서비스
    • 유효처리능력(사용되지 않는 능력)을 공유
  • 유비쿼터스 컴퓨팅
    • 언제 어디든지 어떤 기기를 통해서도 컴퓨팅 할 수 있는 것
  • 엣지 컴퓨팅
    • 말단 기기에서 컴퓨팅을 수행 후 중앙 데이터 센터로 보낸다.
    • 약 10평방 미터 이하 규모의 마이크로 데이터 센터들로 구성된 네트워크
  • 엣지 컴퓨팅 특징
    • 중앙 서버가 아닌 네트워크 단말 쪽에서 데이터를 분석하고 처리한다.
    • 과다 트레픽을 발생을 막으며 안정적으로 실시간 처리
    • 수백 대의 자동차가 동시에 데이터를 쏟아내는 자율주행차에 적합한 기술이다.
  • 클라우드 컴퓨팅 vs 엣지컴퓨팅
    • 클라우드 컴퓨팅이 데이터를 처리하기 위해 데이터 센터가 있는 반면, 엣지 컴퓨팅은 스마트폰과 같은 장치에서 데이터 처리가 가능하다.
  • 클라우딩 컴퓨팅 vs 가상화
    • 쉽게 정의하면 가상화는 기술이고, 클라우드는 방법론이다.
    • 가상화
      • 하나의 서버로 여러 개의 서버 용량을 제공할 수 있는 기술, 즉 하드웨어에서 기능을 분리하는 기술
      • 스케일 업 방식( 서버에 CPU나 RAM등의 부품을 추가하여 서버 자체 성능 업)
    • 클라우드 컴퓨팅
      • 여러 대의 컴퓨터가 공유된 리소스 풀에 엑세스할 수 있도록 하는 것
        • 가상화를 통해 가능하게 된 시스템
      • 스케일 아웃 방식 (서버 대수를 능력 처리능력 업)
  • Saas(SoftWare as a Service)
    • 서비스 제공
      • 전자 메일, 그룹 웨어, CRM, 구글의 Google Apps
  • PaaS(Platform as a Service)
    • 플랫폼 제공
      • 자사의 프로그램 + PasS 개념
      • 자사에서 운용 중인 애플리케이션의 최대 부하를 분산 처리하는 경우
  • IaaS(Infrastructure as a Service)
    • 인프라 제공
      • 물리적 서버 CPU, 메모리, 스토리지 등 하드웨어 자원을 소프트웨어적으로 나누어 사용자에게 제공하는 것 
      • 기업 사용자가 스스로 설치하고 관리해야 함
      • 개발자가 하는 역할이 많음
      • AWS, DropBox, 네이버 클라우드
  • 클라우드 배포 모델
    • 클라우드
      • 클라우드 상에 완전히 배포
    • 온프레미스
      • 프라이빗 클라우드
      • 리소스의 활용도를 높이기 위해 앱 관리 및 가상화 기술이용
    • 하이브리드
      • 클라우드 + 클라우드X 리소스 간 인프라와 앱을 연경
  • 클라우드 이용 모델
    • 퍼블릭 클라우드(1:다)
      • 대규모 산업 그룹을 위해 제공된다. 
      • 클라우드 사용자가 시스템을 구축하고 인터넷 망 등의 네트워크를 통해 불특정 다수의 기업과 개인에게 서비스를 지공하는 형태
      • 클라우드 시스템은 기업 또는 개인의 방화벽 외부에 구축됨
    • 프라이빗 클라우드(1:1개념)
      • 단일 조직에서 독점적으로 사용 하도록 클라우드 인프라를 제공한다. 
      • 데이터 센텨에 클라우드 관련 기술이 활용된 자사 전용 환경을 구축하여 컴퓨팅 리소스를 유연하게 이용할 수 있도록 하는 형태
        • 가상화 자동화 같은 기술 활용 성능과 비용이 최적화되고 유연한 사용자 정의 가능 (1:1)
    • 커뮤니티 클라우드(퍼블릭,프라이빗사이)
      • 공동의 목적을 가진 특정 기업들이 클라우드 시스템을 형성하여 데이터 센터에서 공동 운영
    • 하이브리드 클라우드
      • 조직은 Private 클라우드를 사용하고 다른 클라우드 서비스 업체의 Public 클라우드를 사용하는 것

빅데이터

  • 인공지능 AI

    • 컴퓨터가 인간의 지능적인 행동을 모방
  • 머신러닝
    • 빅데이터를 분석해 미래를 예측하는 기술
    • 데이터를 수집, 분석해 미래를 예측한다는 점에서 빅데이터 분석과 유사하지만 컴퓨터 스스로가 방대한 데이터를 스스로 수집, 학습한다는 점에서 차이가 있음
  • 데이터 마이닝
    • DB로부터 과거에는 알지 못했지만 데이터 속에서 유도된 새로운 데이터 모델을 발견하여 미래에 실행 가능한 정보를 추출해내고 의사 결정에 이용하는 과정을 말한다.
    • 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 정보를 발견해 내는것이다.
  • 머신러닝 학습
    • 지도학습
      • 정답이 있는 데이터를 활용해 학습시키는 방식
      • 분류
        • 이진 분류 :어떤 데이터에 대해 두 가지 중 하나로 분류 하는 것 : YES OR NO 
        • 다중 분류 : 어떤 데이터에 대해 여러 값 중 하나로 분류 하는 것 : What?
      • 회귀
        • 어떤 데어터들의 특징을 토대로 값을 예측
        • 결과 값은 실수 값을 가질 수 있따.
        • (Q) 어디 동네에 어떤 평수 아파트면 집 값이 어느 정도야? (A)어디 동네 24평이면 얼마 이다
    • 비지도학습
      • 정답을 따로 알려주지 않고(Label이 없다.) 비슷한 데이터들을 군집화 하는 것 일종의 그룹핑 알고리즘
        • 특정 동물을 보여주면 다리가 4개, 목이 긴 등의 방식으로 분류함
    • 강화학습
      • 현재의 상태에서 어떤 행동을 취하는 것이 최적인지 학습하는 것
      • 행동을 취할 때마다 외부 환경에서 보상이 주어지는데 이러한 보상을 최대화 하는 방향으로 학습
  • 로지스틱 회귀(2진분류)
    • 회귀를 사용하여 데이터 어떤 범주에 속할 확률을 0~1 사이에 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해 주는 지도 학습 알고리즘
    • ex) 스팸 메일일 확률 0.5이상이면 spam으로 아니면 ham으로 분류, 이렇게 데이터가 2개의 범주 중 하나에 속하도록 결장하는 것
  • 클러스터링(군집화)
    • 유사한 데이터 사례들을 하나의 세트로 그룹화
  • 차원축소
    • 변수 분류 차원을 줄이는 작업
    • 차원수를 줄이면 잠재된 유의미한 관계를 도출하기 용이 해진다.
  • SVM(서포트벡터머신)
    • 커널 트릭은 분리 가능한 비선형 함수를 다차원 분리 가능한 선형함수로 매핑하기 위해 사용
    • 분류를 위한 기준 선을 정의하는 모델이다. 분류되지 않은 새로운 점이 나타나면 경계의 어느 쪽에 속하는지 확인해서 분류 과제를 수행
  • 의사결정 트리, 앙상블 트리
    • 훈련 데이터에서 간단한 의사 겾렁 규칙을 학습해 예측하는 모델
    • 스무고개, 부트스트랩...
  • 빅데이터 인프라
    • 정형 데이터
      • 고정된 형태가 이쓰염 RDMBS에 저장할 수 있는 데이터 방식(excel, csv)
    • 반정형 데이터
      • 고정된 형태가 있고, 연산이 불가능하며 주로 API 형태로 제공, 추가적인 파싱(데이터 처리 기술)이 요구되는 형태
      • XML, HTML, JSON, 로그
    • 비정형 데이터
      • 고정된 형태가 없으며, 연산이 불가능한 형태의 데이터
      • 데이터 수집이 어렵고 용량이 커서 주로 Nosql에 저장된다.
      • Text, 이미지
    • 하둡
      • 아파티 하둡은 대량의 자료를 처리할 숭 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용프로그램을 지원하는 프리웨어 자바 SW 프레임워크
    • 스파크
      • 빅데이터 워크로드에 주로 사용되는 분산처리 시스템, 하둡과 마찬가지로 오픈소스 프로그램
      • 특정한 데이터셋에 대하여 반복처리와 연속적으로 이루어지느 변환 처리 고속화 목적
    • RDBMS 
      • RDMS란 관계형 데이터베이스를 생성하고 수정, 삭제 관리할 수 있는 SW
      • MySQL, SQLite, Oracle
    • NoSQL
      • NOSQL은 스키마가 없어 좀 더 자유롭게 데이터를 관리할 수 있느 데이터 저장 방법
        • MongoDB, Cassand, Redis

   

  

보안이슈

  • 데이터 3법 개정안
    • 신산업 육성을 위해서는 인공지능(AI), 클라우드, 사물인터넷 등 신기술을 활용한 데이터 이용이 필요하다. 그에 안전한 데이터 이용을 위한 사회적 규범 정립을 우해 데이터 3법 개정안이 발의 됐다.
  • 데이터 3법
    • 개인정보 보호법
    • 정보통신망법
    • 신용정보법
  • Covid19 관련 정보보안 위협
    • 코로나19 관련 코로나라는 단어가 포함된 웹사이트가 대량 생산 됨
    • 공공기관을 사칭해 코로나 관련 정보를 공유하는 척 악성 코드를 다운로드 및 실행
  • 재택근무와 보안 위협
    • 소셜엔지니어링 공격
      • 사용자 계정을 탈취하거나 시스템 루트 권한을 뺏기 위한 공격
  • APT(지능형지속위협)
    • 회사 공지사항이나 이력서를 가장한 공격
  • 이모텟(Emotet) 악성코드
    • 당신을 할로윈 파티로 초대합니다등과 같이 사용자의 호기심을 자극하는 스팸 메일 형태의 악성코드
  • 글룹테바(Glupteba)
    • 프로그래밍 언어 고(go)로 개발된 악성코드로 다수의 추가 모듈을 다운로드하며 어려 기능을 갖지만 실직적으로는 모네로(XMR) 코인 마이너를 설하는 암호화폐 채굴 악성 코드이다.
  • NjRAT
    • 키로깅을 포함한 정보 유출 외에도 공격자의 명령을 수행할 수 있으며, 대부분 웹 하드나 토렌트를 통해 정상 파일로 위장하여 유포
  • 로키봇(Lokibot)
    • 인포스틸러 악성코드로서 웹 브라우저, 메일 클라이언트, FTP 클라이언트 등의 프로그램들에 대한 정보를 유출. 주로 스펨 메일 형태로 유포됨에 따라 유사한 유포 파일명을 지니고 있으며, C&C 서버는 대부분 fre.php로 끝나는 특징이 있다.
  • 폼북(Formbook)
    • 인포스틸러 악성코드로서 스팸 메일을 통해 유포되며 유포 파일명도 유사하다.
    • Ex) *아이테크-발주서 송부의견.exe
  • 오픈소스 취약점 발생 사례
    • 아파치 스트럿츠
      • 미국 신용평가기관인 에퀴팩스(Equilfax)는 웹 애플리케이션 개발 오픈소스인 아파치 스트럿츠의 원격코드 실행 취약점 공격으로 약 14천만 명의 개인정보 유출
    • MySQL
      • 오픈소스 DBMySQL 서버의 기본 포트를 통해 암호화 되어있지 않은 서버를 확인하고 랜섬웨어 공격을 시도
    • 쿠버네티스
      • 쿠버네티스에서 파일 복사 시 경로 조작을 통해 악성 파일 실행이 가능한 취약점이 발견됨. 디렉토리 탐색 공격 발생.
  • 인공 지능 보안 관련
    • 딥페이크(Deepfake)
      • 딥러닝과 페이크를 합성한 단어로 인공지능 기반으로 실제처럼 조작한 음성, 영상 등을 통칭
  • 다크웹
    • 익명성이 철저히 보장되고, Tor(The Onion Router) 브라우저와 같은 특정 브라우저를 통해서만 접근이 가능하며, 웹 사이트의 개설 폐쇄가 지속 반복되는 은닉성의 특징을 보유
  • 블루킵(Bluekeep) 취약점
    • 인증 없이 무단으로 PC조작이 가능한 미국 MS사 원격 데스크톱 서비스
    • 공격자가 조작된 원격 데스크톱 프로토콜 패킷을 전송하여 임의 코드를 실행할 수 있는 취약점으로 Window XP, 7 2008 제품 등에 영향

 

기타 IT 상식

  • 쉐어웨어
    • 일정기간 사용한 뒤에는 대금을 지불하고 정식 사용자 등록을 하라고 유도하는 SW
  • 프리웨어
    • 무료로 복제하고 사용할 있도록 공개 SW
  • 프록시 서버
    • 클라이언트와 서버사이에서 중개자 역할 하는 서버
  • 캐시
    • 데이터 중 사용자의 요청이 많은 것을 프록시 서버에 저장해 두었다가 사용자의 요청이 있을 경우 신속하게 전달
  • 망중립성
    • 유무선 통신네트워크를 서비스 사업자에게 평등하게 제공해야 한다는 원칙
  • MVNO
    • 이동통신망을 보유하지 않고 SKT,LG유플러스,KT 등 네트워크 사업자로부터 통신망을 임대하여 무선 통신 서비스를 제공하는 가상이동통신망 사업자
    • Ex) CJ헬로
  • 와이파이
    • 무선접속장치(AP)가 설정된 곳의 일정 거리안에서 초고속인터넷 접속 가능한 근거리 통신망
    • IEEE 802.11
  • NFC
    • 10cm 정도의 근거리에서 낮은 전력으로 단말기 간 데이터를 전송할 수 있으며 정보를 읽고 쓰는 것이 가능한 비접촉식 근거리 무선통신 방식
  • 인슈어테크
    • 데이터 분석과 인공지능(AI) 등 정보기술(IT)를 활용해 기존 보험산업을 혁신하는 서비스, 보험(insurance) + 기술(Tech)의 합성어
  • 판옵티콘
    • 컴퓨터 통신망과 DB를 통해 개인의 사생활을 감시 침해 하는 대상을 비유하는 말
  • 디제라티
    • 디지털시대에서 엘리트로 떠오르는 신지식인, 디지털과 지식계급의 합성어
  • CCL(Creative Commons License)
    • 불특정 다수가 마음대로 이용할 수 있게 하는 라이센스
반응형

+ Recent posts