●핫한 넷플릭스 영화/TV쇼의 트렌드는? [데이터 분석] 최근

서론 세계 최대 비디오 스트리밍 서비스 기업 넷플릭스! 다들 이용하고 있죠? 넷플릭스는 2019년 당시 7,787개 이상의 콘텐츠를 보유하고 있으며, 전 세계 1억 3,500만 유료고객과 계약을 체결했다고 밝혔습니다. 많은 사람들이 넷플릭스를 이용하고 있는 만큼 수년간의 넷플릭스 트렌드를 파악하는 것은 곧 현대인의 트렌드를 파악할 수 있는 방법이라고 생각됩니다. 따라서 이번 글에서는 넷플릭스 영화와 TV쇼 타이틀의 데이터 셋을 분석하여 몇 년 동안 어떤 경향이 있었는지 살펴보겠습니다. 이 글을 통해 넷플릭스가 어떤 방법으로 빅데이터를 수집, 분석하고 사용자 기반의 서비스를 확장해 왔는지 알 수 있습니다.데이터 셋 데이터 셋은 데이터 분석 플랫폼인 kaggle에서 획득하며 추가로 다양한 변수를 포함하고 있습니다. “영화 및 TV프로그램 제목과 함께 감독, 출연진, 날짜, 개봉연도, 설명, 기간 등을 추가하였습니다” 이런 변수들을 사용해서 좀 더 다양하게 관찰하고 시각화의 결과를 낼 수 있었습니다.

분석

이 차트를 보면 영화 제목 수가 TV쇼보다 더 많은 걸 알 수 있어요 그러나 2020년이 다가올수록 영화 편수는 떨어지고 TV쇼가 증가합니다. 왜 그랬을까요?

유력한 원인 중 하나는 코로나 19의 유행입니다. 코로나19의유행으로영화산업이축소된것입니다. 동시에 넷플릭스 오리지널 시리즈는 흥행에 성공하고 TV쇼는 확대된 것으로 분석할 수 있습니다.

이 두 차트에서는 2010년부터 2020년까지 매달 추가된 콘텐츠 수와 월평균 타이틀 수를 나타내고 있습니다. 보시는 바와 같이 2월에 추가된 콘텐츠 양이 가장 적고 10월이 가장 많습니다.

이 박스플롯에서는 상위 11개국의 넷플릭스 영화 상영 시간을 볼 수 있습니다. 주목할 점은 2001년 119분에서 2020년 90분으로 몇 년 새 평균 상영시간이 줄었다는 점입니다.

이 차트에서는 등급별 영화 / TV 쇼 타이틀 수와 출연진의 반복 횟수를 보실 수 있습니다. R영화나 발리우드 배우를 많이 볼 수 있지요.

넷플릭스의 타이틀에서 가장 많이 나타난 단어를 워드 클라우드로 하면, 다음과 같이 됩니다. 사랑과 크리스마스에 관한 주제가 많은게 눈에 띄네요!

결론넷플릭스가 성공한 핵심 요인 중 하나는 빅데이터 활용입니다. 고객의 이용 정보와 패턴을 수집하고, 그들이 다음에 어떤 컨텐츠를 봐야 하는지 추천해 줍니다. 넷플릭스는 이러한 형태의 데이터를 지속적으로 수집하고 분석하여 매년 발전할 수 있었습니다. 세계 어느 지역에 어떤 콘텐츠를 추가하는지 파악하고 지속적으로 사용자 기반의 서비스를 향상시키는데 그들이 수집한 빅데이터는 매우 중요하게 작용했을 것입니다.

데이터 활용, 넷플릭스 같은 기업만 가능한가요? 아닙니다! 우리도 충분히 많은 데이터를 수집하고 이를 분석하고 다양한 분야에 적용할 수 있습니다. 스파이더 김으로 필요한 정보를 빠르게 수집하세요!

출처 : https://nycdatascience.com/blog/r/eda-on-netflix/

데이터를바탕으로연구해보고싶은분야가있습니까? 스파이더 김을 통해 쉽게 필요한 데이터를 수집하세요!

error: Content is protected !!