배경
코딩, 모델링, 복잡한 통계분석에 앞서 그 이전’의 과정(문제인식, 데이터 수집, 분석 방법 선정 등)에서 ‘왜’ 이것이 필요한지에 대한 깊은 고민을 통해 실무에서 유의미한 성과를 내기 위해 무엇을 해야 될지 알아보는 것이 중점인 데이터 리터러시 스터디의 목적에 맞춰서 린 분석과 AARRR의 지표를 중심으로 분석을 할 수 있는 대상을 선정하게됨. 마침 지인인 유튜버 경돼의 채널 성장 니즈와 맞아 떨어져 분석을 진행하게 되었음
인터뷰를 통한 린 캔버스 정리
유튜브 관련 자료(래퍼런스) 조사
분석 가설? (인터뷰, 래퍼런스를 통한)
•
업로드 횟수(4회 이하, 5회이상)에 떄란 평균 업로드 조회수는 차이가 있을 것이다.
•
컨텐츠 유무에 따른 평균 업로드 조회수는 차이가 있을 것이다.
기간
2021.05.01 ~ 2021.06.01
수행인원
데이터 분석 5명(팀장(본인), 팀원)
역할
인터뷰 진행, 분석 가설 설정, PPT 제작
프로젝트 진행 환경
사용 OS
•
Mac
사용 툴
•
Python
사용 패키지
•
pandas, re, os, sklearn, matplotlib, seaborn, numpy, scipy
google API를 활용한 크롤러를 통해 경돼 채널의 데이터를 수집 후 전처리 과정을 진행
날짜 전처리
영상길이
날짜 별 업로드 횟수
상관분석
연도별 평균 조회수
조회수 라인 그래프
댓글 반응
연도별 월 평균 업로드 횟수
월 별 업로드 횟수에 따른 조회수 차이
컨텐츠 유무에 따른 조회수 차이
결론
: 주 1회이상 제목에 컨텐츠를 포함한 영상 업로드가 필요함.
•
피드백 후 이전 영상에 비해 1.5배 정도 조회수가 상승 한 것을 확인 할 수 있음.
•
현재는 개인 사정으로 유튜브에 전념을 못하고 있음.
프로젝트에서 좋았던 점
•
린분석 책을 기반으로 여러가지 지표에 대한 공부 및 유튜브 생태계를 어느정도 이해 하는데 도움이 됨
•
처음으로 Google API 사용해서 어느정도 실무에 적용 가능한 능력을 기를 수 있었음
프로젝트에서 아쉬웠던 점(배운점)
결론의 피드백 후 실제 조회수 효과 파악의 어려움
•
채널 본주인의 계정 공유 이슈로 인해 실제 어느정도 기간을(예) 업로드 후 1주 이내) 두고 이전 영상과 A/B test로 비교가 필요 했지만 불가능 했음
팀원들과 일 분배의 아쉬움
•
팀원들이 실제 인터뷰 부터 진행하는 분석과 Python에 익숙하지 못해 대부분의 과정을 내 주도하에 진행함. 이번 프로젝트를 통해 팀원들의 코딩 실력도 늘어서 일 분배에 대한 걱정은 없을 것 같음.