플레이북

다운로드 이벤트

개인정보를 입력하시면

바로 플레이북을 다운로드 받을 수 있습니다.

지금 다운받으세요! 

Search

불붙은 클라우드 기반 DW 성능 경쟁 - 애저가 아마존 Redshift를 앞서가나요 ~ ~

최근 클라우드 기반 데이터웨어하우스 서비스 경쟁이 갈수록 치열해지고 있습니다. 한동안 아마존 Redshift가 주도하나 싶더니, 오라클이 최근 오라클 오토노머스 데이터웨어하우스를 공개하면서 전통적인 강자(?)의 면모를 보여 주었죠. 이 경쟁에 마이크로소프트가 '나도 있다'라는 강력한 메시지를 보내고 있습니다. 마이크로소프트가 앞세우는 것은 성능과 가성비입니다. 


Azure SQL Data Warehouse ~ 아마존 Redshift 잡으러 왔다!


마이크로소프트가 제공하는 클라우드 기반 데이터웨어하우스 서비스 이름은 '애저 SQL 데이터웨어하우스(Azure SQL Data Warehouse)'입니다. 이 서비스 관련 벤치마크 결과를 마이크로소프트가 공개했는데요, 그 수치가 인상적입니다. 공정을 기하기 위해 기가옴 리서치(Gigaom Research)를 통해 벤치마크를 수행했는데요, 주요 결과를 보시죠.  먼저 30TB 규모의 데이터를 대상으로 한 쿼리 수행 성능 비교입니다. 업계에서 널리 쓰이는 TPC-H 표준으로 벤치마크를 진행한 결과 애저가 아마존보다 67% 정도 빠른 것으로 나왔습니다. 노드 수에 관계없이 일정한 편차가 보이는 걸로 봐서 전반적으로 성능이 앞선다고 봐도 되겠습니다. 



성능 다음으로 중요한 포인트는 뭐니 해도 가격 대비 성능이죠. 30TB 규모의 데이터를 다루는 워크로드를 기준으로 '가성비'를 따져보니 애저가 아마존보다 23% 정도 저렴한 것으로 나타났습니다. 



동치 처리 쿼리 수 120:50 ~ 애저가 유리


데이터웨어하우스 운영자 입장에서 가장 중요한 보는 것이 하나 더 있습니다. 사실 운영자 입장에서 성능과 가격보다 이게 더 중요할 수 있습니다. 바로 동시에 처리할 수 있는 쿼리 수입니다. 이게 제약이 심하면 아무리 성능이 좋고 가격이 매력적이라도 엔터프라이즈 환경에서 쓸 때 운영자가 사용자들의 원성(?)을 들을 위험이 있죠. 그래서 어느 정도까지 동시 처리를 보장하는지 잘 살펴야 합니다.  동시 처리 가능한 쿼리 수를 비교해 보면 애저 SQL 데이터웨어하우스가 아마존 Redshift보다 2배 이상 넉넉합니다. 애저에서는 동시에 128개의 쿼리 처리가 가능한 반면 아마존은 50개 제약이 있습니다. 50개 뒤로 들어오는 쿼리는 앞서 보낸 쿼리 수행이 끝날 때까지 대기해야 합니다.  최근 엔터프라이즈 데이터웨어하우스 환경의 부하 분산 및 새로운 분석 수요를 클라우드에서 수행하는 것에 관심이 커지고 있습니다. 관련해 담당자는 성능, 가격, 동시 처리 등 여러 면을 잘 따져 봐야 할 것 같네요.


#AzureSQLDataWarehouse #Redshift

1 view