이제 태블로를 이용해서 가지고 있는 데이터를 다양하게 분석해보자
커뮤니티 신규 가입회원의 성별/연령 정보를 가진 테이블이 구글스프레드시트에 있다
데이터를 추출하는 과정이 자동화되지않고, 일단위 분석이 필요한 도메인이 아니라서
처음부터 월단위로 데이터를 추출했다
단, 데이터 추출과정에서 생긴 통계인 '연령별-전체', '비율' 은
태블로 사용법 습득을 위해 없는 것으로 가정하고 진행한다
[분석 목표]
신규 회원가입의 추세를 확인!
가입자의 인구통계적 특성과 추세를 확인!
[워크시트 만들기]
(1) 연령구분을 무시하고 시계열 추세를 보여주는 꺾은선그래프
- '연령별'에서 Create - Group 으로 모든 연령을 그룹핑한 새로운 필드를 만든다
- 연령대그룹과 가입자수를 Rows로, 월별구분을 Columns 로 지정
(2) 연령대/성별 그룹 비중을 나타내는 그래프
두가지 categorical 필드를 사용하기 때문에 먼저 다음의 질문을 해야한다
Q. 연령과 성별 중 어떤 것이 더 중요한 의미를 가지는가?
A.
본 서비스에는 연령대별로 이용목적이 다소 다르게 나타나는 특성을 가지고 있는 자명한 사실이 있다.
하지만, 위의 두 그래프를 비교해보면 40대-50대에서만 성별에 따른 차이가 크게 발생하는 것을 볼 수 있다.
그러므로 2안과 같이 연령대별 구분을 기본으로 하되, 남여의 비율차이 또한 확인할 수 있어야 한다
그리고 더 나은 시각화를 위해 고려할 사항이 있다
- 2안처럼 Analytics-Total 기능을 이용해서, 남/여/total 로 나타내면 막대의 갯수를 많아서 가시성이 떨어진다
- 파이차트는 연령대별 비율을 직관적으로 보여줄 수 있으나 2가지 필드를 동시에 보여주기 어렵다
그리하여 만들어진 그래프는...
- 누적막대그래프(Stacked Bars) 스타일로 연령대별 막대그래프 생성
- 성별 비율을 Color Mark 로 표현
서비스 이용목적에 차이가 생기는 연령대 구분을 명확하게 보여주면서도
연령대별로 성별비율의 차이가 생기는 40-50대 연령구간의 특징을 잘나타낼 수 있다
... 고 생각함 ^-^
'데이터 분석 & 기획 > 태블로' 카테고리의 다른 글
태블로 기초 - 데이터불러오기, 그래프만들기 (2) | 2023.01.19 |
---|