Amazon Redshift

2023. 7. 4. 14:52AWS (Amazon Web Services)

※ 해당 블로그는 AWS에서 제공하는 설명서와 AWS Builders Online Series 강의를 듣고 개인적으로 공부한 내용을 정리한 블로그입니다.

 

Amazon Redshift

  • 신속하며 완벽하게 관리되는 페타바이트 규모의 데이터 웨어하우스 서비스
  • 비용 효율적으로 간편하게 모든 데이터를 분석 할 수 있게 해주는 서비스
  • 컬럼 기반의 저장 방식을 사용하여 데이터를 효율적으로 압축하고 처리
  • Amazon Redshift Spectrum을 사용하면 Amazon S3의 파일에 저장된 데이터를 SQL로 쿼리 할 수 있음
  • Amazon Athena 서비스를 사용해도 Amazon S3의 파일에 저장된 데이터를 SQL로 쿼리 할 수 있음
  • Amazon Redshif에서 조회한 데이터를 시각화 하기 위해서는 일반적으로 Amazon QuickSight 도구에 연결
  • Amazon QuickSight에 연결하여 대시보드, 파트, 그래프 등을 생성하여 데이터를 시각적으로 표현 할 수 있음
  • 교차 리전 스냅샷 구성을 통해 오류 발생 시에도 장기적인 가용성을 보장할 수 있음

 

예시 문제

1. Amazon Redshift는 분석을 수행하고 고객 보고서를 생성하는 데 사용된다. 이 회사는 고객에 대한 추가 50테라바이트의 인구 통계 데이터를 얻었다. 데이터는 Amazon S3 in.csv 파일에 저장된다. 회사는 데이터를 효율적으로 병합하고 결과를 시각화하는 시스템이 필요하다.

 

솔루션 아티텍트는 이러한 요구 사항을 충족하기 위해 어떤 권장 사항을 제시해야 하는가?

 

1) Amazon Redshift Spectrum을 사용하여 Amazon S3의 데이터를 직접 쿼리하고 해당 데이터를 Amazon Redshift의 기존 데이터와 결합한다. Amazon QuickSight를 사용하여 시각화를 구축한다.

 

2) Amazon Athena를 사용하여 Amazon S3의 데이터를 쿼리한다. Amazon QuickSight를 사용하여 Athena의 데이터를 Amazon Redshift의 기존 데이터와 결합하고 시각화를 구축한다.

 

3) Amazon Redshift 클러스터의 크기를 늘리고 Amazon S3에서 데이터를 로드한다. Amazon EMR 노트북을 사용하여 Amazon Redshift에서 데이터를 쿼리하고 시각화를 구축한다.

 

4) Amazon Redshift 클러스터의 데이터를 Amazon S3의 Apache Elasticsearch Service(Amazon ES)를 사용하여 데이터를 쿼리한다. Kibana를 사용하여 결과를 시각화한다.

 

정답 : 1

Amazon S3의 데이터를 직접 쿼리하기 위해서는 Amazon Redshift Spectrum을 사용해야하며 분석한 데이터를 시각화하기 위해서는 주로 Amazon QuickSight를 사용하기 때문입니다.

 

 

2. 기업의 데이터 웨어하우스는 Amazon Redshift를 사용한다. 회사는 구성 요소 오류 발생 시 데이터의 장기적인 가용성을 보장해야 한다.

 

솔루션 아키텍트는 어떤 권장 사항을 제시해야 하는가?

 

1) 동시성 확장을 활성화 한다.

 

2) 교차 리전 스냅샷을 활성화한다.

 

3) 데이터 보유 기간을 늘린다.

 

4) 다중 AZ에 Amazon Redshift를 배포한다.

 

정답 2

교차 리전 스냅샷을 활성화 하면 오류가 발생 해도 데이터가 다른 리전에 백업되어 있기 때문에 가용성을 보장할 수 있습니다.

'AWS (Amazon Web Services)' 카테고리의 다른 글

AWS Storage Gateway  (0) 2023.07.04
Amazon API Gateway  (0) 2023.06.23
Amazon SQS  (0) 2023.06.21
Amazon Kinesis Data Firehose  (0) 2023.06.17
Amazon ECS  (0) 2023.06.16