본문 바로가기

Python

(4)
[Python] 이커머스 데이터 퍼널 분석(Funnel Analysis) 퍼널 분석(Funnel Analysis)사용자가 특정 목표(예: 구매 완료)에 도달하는 과정에서 각 단계별로 얼마나 많은 사용자가 이탈하는지를 분석하는 방법론사용자가 어디에서 이탈하는지 파악하는 데 도움이 되며, 그 이유를 이해하여 이탈률을 줄이고 전환율을 높일 수 있는 장점이 있다.0. 패키지 및 데이터 로드import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltdf = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/퍼널 분석/user_data.csv')dfstage: 각 단계conversion: 해당 단계의 다음 단계로 넘어가는지 여부1. 전환율(Conversion Rat..
[Python] 이커머스 고객 세분화 분석 (RFM, 코호트 분석) RFM 분석고객의 구매 행동을 기반으로 충성도 높은 고객을 식별하고 마케팅 전략을 최적화하는 데 사용되는 데이터 분석 기법 RFM 분석의 세 가지 요소Recency (최신성): 고객이 마지막으로 구매한 날짜 (최근 구매일)Frequency (빈도): 고객이 특정 기간 동안 몇 번 구매했는지 (구매 횟수)Monetary (금액): 고객이 특정 기간 동안 총 얼마를 소비했는지 (구매 금액)0. 패키지 불러오기import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.font_manager as fmimport datetime as dt1. 데이터 로드 및 전처리(1) 데이터 로..
[Python] 결측치 보간법 (1/2차 선형보간법, 평균대치법, KNN, MICE) 데이콘의 결측치 보간 챌린지 데이터를 사용하여 결측치를 보간하는 여러 가지 방법에 대해 알아보겠습니다.# 패키지 세팅import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.impute import SimpleImputer, KNNImputerfrom sklearn.experimental import enable_iterative_imputerfrom sklearn.impute import IterativeImputer # 데이터 로드data = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/공모전/data.csv')df = ..
[Python] 이상치 탐지 기법 (IQR, Isolation Forest, rolling 함수, decompose 패키지) 이상치란?전체 데이터의 대부분의 패턴, 범위에서 크게 벗어난 값인데 아주 작은 값일 수 있고, 아주 큰 값일 수 있습니다. 이상치를 중요하게 바라봐야 하는 이유는?극단적인 값으로 인해 통계치 또는 ML 학습에서 영향을 받게 되기 때문입니다. 도메인의 영향이상치는 도메인에 따라, 이상치 탐지 기법에 따라 다를 수 있기 때문에 도메인의 영향을 받습니다.이번 포스팅에서는 임의로 이상치가 포함된 데이터셋을 만들고, 여러 방법을 사용한 이상치 탐지 기법을 알아보겠습니다.먼저 이상치 탐지에 필요한 패키지를 로드합니다.import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 이상치 탐지 방법 from sk..