데이터 활용

1 minute read

데이터 활용에 대한 전반적인 내용을 간략히 정리합니다.

1) 데이터 리터러시

리터러시(Literacy)란 문해력, 글을 읽고 쓸 줄 아는 능력이다.

데이터 리터러시는 데이터를 읽고, 해석하고, 통계를 분석적으로 고려하고, 증거로서 통계를 사용할 줄 아는 능력이다.

데이터 리터러시 역량에는 기획, 수집, 관리, 분석, 시각화 등이 있다.

  • 데이터 기획
    • 현재 문제가 무엇이고 무엇을 하고 싶은 것인지?
      • ex) 제주도 대중교통 불편 문제
    • 문제해결을 위한 가설 설정
    • 내가 세운 가설이 적절한지
  • 데이터 수집
    • 데이터 수집 육하원칙 feat.(스타벅스 1호 데이터 사이언티스트)
      • 누가 : 개인정보, 식별정보
      • 언제 : 연월일시분초
      • 어디서 : 매장이름, 주소
      • 무엇을 : 채용 기준 정보
      • 어떻게 : 결제 수단, 쿠폰 사용 여부
      • 왜 : SNS 분석, 설문조사
  • 데이터 관리
    • 수집한 데이터의 출처가 깨끗하고 사용 가능한 것인지
    • 데이터에 오류, 변수가 얼마나 포함되어있고 추가되지 않은 데이터는 없는지
    • 데이터의 양이 방대하다면 효율적인 관리를 위해 팀원을 확보
  • 데이터 분석
    • 현재 데이터셋이 하고자 하는 작업에 적합한지
    • 데이터셋을 통해 무엇을 알아낼 수 있는지
    • 데이터를 분석한 결과가 유의미한 것인지
    • 내가 세운 가설이 검증 될 수 있는지
  • 데이터 시각화
    • 데이터를 통해 찾아낸 의미를 어떻게 전달할 것이지
    • 누구에게 어떤 방법으로 전달할 것인지
    • 데이터를 모르는 사람도 한눈에 의미를 알 수 있는지
    • 제작된 결과물이 편향되지는 않았는지
    • 데이터 시각화 참고 사이트 https://ft-interactive.github.io/visual-vocabulary/

데이터 리터러시를 통한 성공 사례

  1. 아마존
    1. 2014 년에 출시한 prime now - 사용자 데이터를 기반으로 추론해서 장바구니에 추가한 물건이 미리 배송 시작된다.
  2. 나이키
    1. 대형 오프라인 매장을 통해 일반 유저의 디자인 데이터를 받아 활용
  3. 자라
    1. 데이터를 기반으로 제품 기획부터 생산, 유통까지 최적화 하여 영업 이익률 증대

2) 데이터 활용 케이스

  • 머신러닝 기반 폐기물 발생량 예측 시스템 (광주광역시 광산구 시설관리공단)
    1. 문제 : 폐기물 발생량 급증 → 주민 불편 초래 → 공단의 비효율적 운영
    2. 데이터 수집 및 전처리
      1. 폐기물 발생량의 사회적 결정요인

        [ 사회구조, 도시규모, 생활수준, 계절, 기상상황, 공휴일 ]

    3. 데이터 수집/분석/예측 자동화
      1. 데이터 전처리
      2. 머신러닝 모델 학습
      3. 데이터 파이프라인 구축
    4. 업무 활용 프로세스
      1. 지원팀 운용
      2. 단기 근로자 채용
    5. 성과
      1. 민원 20% 감소
  • ‘가치있는’ 데이터 활용을 위한 관점의 변화
    • 데이터 기반 접근 보다는 문제(비즈니스)에 기반해서 접근

3) 데이터 기반 사고방식

데이터 기반 사고는 실행을 뒷받침할 정량적 혹은 정성적인 근거과 명확한 것을 의미한다.

  • 핵심 맥락을 파악하고 더 나은 의사 결정하는 것이 포인트이다.
  • 기존에는 기획 및 마케팅 직군의 데이터 활용만 옆에서 지켜보기만했는데 직접 데이터에 의미를 두고 분석해나가는 내용을 학습하면서 그동안 미쳐 고려하지 못했던 부분들에 대해 생각해볼 수 있었다.
  • 데이터의 중요성에 대해 더 잘 느끼게 되었고, 문제를 해결을 위해 데이터를 중심으로 두는 사고를 연습해나가야겠다.
-->

Categories:

Updated:

Comments