데이터 활용
데이터 활용에 대한 전반적인 내용을 간략히 정리합니다.
1) 데이터 리터러시
리터러시(Literacy)란 문해력, 글을 읽고 쓸 줄 아는 능력이다.
데이터 리터러시는 데이터를 읽고, 해석하고, 통계를 분석적으로 고려하고, 증거로서 통계를 사용할 줄 아는 능력이다.
데이터 리터러시 역량에는 기획
, 수집
, 관리
, 분석
, 시각화
등이 있다.
- 데이터 기획
- 현재 문제가 무엇이고 무엇을 하고 싶은 것인지?
- ex) 제주도 대중교통 불편 문제
- 문제해결을 위한 가설 설정
- 내가 세운 가설이 적절한지
- 현재 문제가 무엇이고 무엇을 하고 싶은 것인지?
- 데이터 수집
- 데이터 수집 육하원칙 feat.(스타벅스 1호 데이터 사이언티스트)
- 누가 : 개인정보, 식별정보
- 언제 : 연월일시분초
- 어디서 : 매장이름, 주소
- 무엇을 : 채용 기준 정보
- 어떻게 : 결제 수단, 쿠폰 사용 여부
- 왜 : SNS 분석, 설문조사
- 데이터 수집 육하원칙 feat.(스타벅스 1호 데이터 사이언티스트)
- 데이터 관리
- 수집한 데이터의 출처가 깨끗하고 사용 가능한 것인지
- 데이터에 오류, 변수가 얼마나 포함되어있고 추가되지 않은 데이터는 없는지
- 데이터의 양이 방대하다면 효율적인 관리를 위해 팀원을 확보
- 데이터 분석
- 현재 데이터셋이 하고자 하는 작업에 적합한지
- 데이터셋을 통해 무엇을 알아낼 수 있는지
- 데이터를 분석한 결과가 유의미한 것인지
- 내가 세운 가설이 검증 될 수 있는지
- 데이터 시각화
- 데이터를 통해 찾아낸 의미를 어떻게 전달할 것이지
- 누구에게 어떤 방법으로 전달할 것인지
- 데이터를 모르는 사람도 한눈에 의미를 알 수 있는지
- 제작된 결과물이 편향되지는 않았는지
- 데이터 시각화 참고 사이트 https://ft-interactive.github.io/visual-vocabulary/
데이터 리터러시를 통한 성공 사례
- 아마존
- 2014 년에 출시한
prime now
- 사용자 데이터를 기반으로 추론해서 장바구니에 추가한 물건이 미리 배송 시작된다.
- 2014 년에 출시한
- 나이키
- 대형 오프라인 매장을 통해 일반 유저의 디자인 데이터를 받아 활용
- 자라
- 데이터를 기반으로 제품 기획부터 생산, 유통까지 최적화 하여 영업 이익률 증대
2) 데이터 활용 케이스
- 머신러닝 기반 폐기물 발생량 예측 시스템 (광주광역시 광산구 시설관리공단)
- 문제 : 폐기물 발생량 급증 → 주민 불편 초래 → 공단의 비효율적 운영
- 데이터 수집 및 전처리
-
폐기물 발생량의 사회적 결정요인
[ 사회구조, 도시규모, 생활수준, 계절, 기상상황, 공휴일 ]
-
- 데이터 수집/분석/예측 자동화
- 데이터 전처리
- 머신러닝 모델 학습
- 데이터 파이프라인 구축
- 업무 활용 프로세스
- 지원팀 운용
- 단기 근로자 채용
- 성과
- 민원 20% 감소
- ‘가치있는’ 데이터 활용을 위한 관점의 변화
- 데이터 기반 접근 보다는 문제(비즈니스)에 기반해서 접근
3) 데이터 기반 사고방식
데이터 기반 사고는 실행을 뒷받침할 정량적 혹은 정성적인 근거과 명확한 것을 의미한다.
- 핵심 맥락을 파악하고 더 나은 의사 결정하는 것이 포인트이다.
- 기존에는 기획 및 마케팅 직군의 데이터 활용만 옆에서 지켜보기만했는데 직접 데이터에 의미를 두고 분석해나가는 내용을 학습하면서 그동안 미쳐 고려하지 못했던 부분들에 대해 생각해볼 수 있었다.
- 데이터의 중요성에 대해 더 잘 느끼게 되었고, 문제를 해결을 위해 데이터를 중심으로 두는 사고를 연습해나가야겠다.
Comments