본문 바로가기
AWS SAA-C02

SAA-C02 시험직전요약::EC2와 스토리지/데이터분석

by krheyjin 2021. 5. 27.
728x90
반응형

EC2요금
-스탠다드 인스턴스
-예약 인스턴스:이용기간을 장기지정하면 온디맨드보다 75%저렴하다
-스폿 인스턴스:최대 90%절약. 예비용이어서 작업도중에 삭제될 위험이 있으므로 일시적 확장용도등, 한정된 사용추천.

물리적 인스턴스
-하드웨어 전용 인스턴스:호스트하드웨어VPC에서 실행되는 인스턴스
-Dedicated Host:EC2인스턴용량을 완전히 전용으로 이용가능

EC2
-EC2에 MySQL서버를 만들수도 있다.(물론, RDS의 MySQL을 만드는것도 가능,managed, unmanaged의 차이)
-내용을 AMI로서 백업할수 있다.(AMI는 S3에 저장된다)

EC2의 스토리지
-인스턴스 스토어:블록레벨의 스토리지, EC2종료시 내용이 사라짐, 무료
-EBS:네트워크 연결된 블록레벨의 스토리지로 EC2와는 구별됨. SnapShot을 S3에 저장

EBS
-같은 AZ안의 인스턴트에만 바꿔 달수 있음.
-SnapShot은 다른 AZ에도 복원할 수 있음. 다른 리젼에도 복원할 수 있음

EBS 볼륨타입
-범용SSD:저지연성이 필요한 어플, 개발환경, 가상데스크톱, 소~중규모의 DB
-프로비젼IOPS:빈번한 I/O가 필요한 NoSQL이나 어플, 대규모 워크 로드가 필요한 DB
-쓰루풋최적화HDD:빅데이터 처리, DWH, 대규모ETL처리및 로그분석, 루트(부트)볼륨으로는 사용불가능
-콜드HDD:로그데이터등 액서스 빈도가 낮은것, 백업,아카이브. 루트(부트)볼륨으로는 사용불가능
-마그네틱:데이터로의 액서스 빈도가 낮은 워크로드

S3액서스 관리
-IAM폴리시,버킷폴리시,ACL,서명된URL을 이용해 액서스 관리 가능.
-특히 ACL은 각각의 오브젝트 단위로 액서스 관리를 할수 있다.
-억세스 애널라이저가 있어서 버킷폴리시, ACL를 모니터링할수 있다.
-크로스 어카운트 억세스
버킷폴리시와 IAM폴리시로 설정:
ACL와 IAM폴리시로 설정:S3에 있는 특정 오브젝트에 액서스를 허가할떄는 ACL을 이용
IAM롤로 설정:프로그램, 콘솔액서스에 의한 접근등에 IAM롤 권한이양을 사용.

S3암호화
-SSE-S3:간단함. AES-256을 사용해 데이터 암호화
-SSE-KMS:AWS KMS에 설정한 암호화카를 이용해 암호화를 실시. 유저측에서 암호화키를 관리, 작성(KMS사용)
-SSE-C:유저가 지정한 키에 따른 서버측 암호화. 이용설정과 관리가 번잡함.
-CSE:클라이언트 측 암호화. S3에 송신하기 전에 데이터를 암호화함. KMS등을 사용해서 암호화. 어플안에 저장한 마스터키를 사용.

S3데이터 분석
-S3 select:S3 내부 검색 기능
-Amazon Athena:검색 분석등이 가능한 쿼리서비스
-Amazon Macie:기계학습에 의해 기밀데이터등의 검출, 분류등이 가능
-Amazon Redshift Spectrum:S3에 있는 데이터에 대해 Redshift에서 직접쿼리를 실행할 수 있음

S3외부연결
-AWS Storage Gateway:이용하는 데이터타입에 따라 또 나뉜다
파일게이트웨이:S3오브젝트에 Storage Gateway를 경유하여 파일데이터를 저장 
볼륨게이트웨이:S3및 Snapshots을 백엔드로 하는 블록스토리지
테입게이트웨이:S3과 Glacier에 데이터를 보관하는 가상 테입스토리지와 VTL관리

S3 Glacier
-볼트:볼트는 리젼에 작성되며 아카이브를 저장하는 컨테이너
-아카이브:Glacier의 기본단위
-잡:아카이브에 SELECT 쿼리를 실행하거나 아카이브를 취득함.(시간이 걸림)
-통지설정:잡완료를 SNS와 연계하여 통지해줌
-Glacier는 일시 데이터를 아카이브에 저장하고(고속), 볼트에 장기저장(느림)함
-데이터의 취득타입과 취득에 걸리는 시간에 따라 요금이 달라짐
-액서스관리:IAM폴리시, 볼트폴리시, 데이터 취득(取り出し)폴리시, 볼트락 폴리시, 서명

S3 Glacier Deep Archive
-S3 Glacier보다 더 저렴함. 데이터를 복원하는데는 더 시간이 걸림

전송고속화
-S3 Transfer Acceleration:클라이언트와 S3버킷간에 장거리간 송신을 서포트.(대륙간에 GB~TB 단위의 전송등)
-Snowball:물리 스토리지 디바이스를 사용하여 인터넷을 우회하여 AWS와 대용량 데이터전송을 고속화. 암호화가 강제됨.

EFS
-파일 스토리지
-인터넷을 통한 접속은 불가능

Amazon FSx For Windows File Server
-윈도우에 구축함. Windows AD, OS, 소프트웨어와의 연계가 풍부.SMB프로토콜사용하여 EC2등과 연결가능

Amazon Fsx For Lustre
-슈퍼컴퓨터에 이용되는 분산파일시스템.병렬처리전용 고기능성 스토리지를 제공.

Kinesis
-스트림 데이터를 수집, 처리하기위한 full-managed서비스
-3개의 서비스로 구성됨(Amazon Kinesis Steams, Amazon Kinesis firehose, Amazon Kinesis Analystics)

Amazon Kinesis Steams
-스트리밍 처리를 셔드(Shard)로 분리해서 분산하여 실행하기때문에 고속처리가 가능

Amazon Kinesis firehose
-각종 DB에 송신, 축적 하기위한 스트림처리. 람다와 연결하면 ETL으로서도 이용가능

Amazon Kinesis Analystics
-스트림 데이터를 표준적인 SQL쿼리로 리얼타임 분석

RedShift
-고속이고 스케일러블한 비용효과적인 DWH/데이터레이크 분석서비스
-노드를 추가하거나, 클러스터를 추가함으로써 스케일링을 구현

RedShift Spectrum
-유저가 관리하는 S3버켓에 직접적으로 데이터분석을 실행하게 해줌(쿼리 엔진)

Amazon QuickSight
-데이터를 가시화, 분석하기위한 BI툴

AWS Glue
-ETL기능

#제 돈 주고산 유료강의를 듣고 정리한 요약노트입니다.
#AWS비슷비슷한 서비스, 기능들 위주로 요약했습니다.
#일본거주자라 일본어강의여서 가끔 단어가 이상할 수 있습니다.

 

728x90
반응형

댓글