본문 바로가기

반응형

Python

[Python] 커서(Cursor): 파이썬과 MySQL 연동 이전 포스팅:https://choiwonjin.tistory.com/45 [SQL] 커서(Cursor) 개념과 사용법커서(Cursor)란?SQL 쿼리 결과를 프로그램(stored procedure) 내부에서 한 행씩 반복 처리할 수 있게 해주는 포인터(pointer)대량 데이터에 대해 셋 기반 연산(UPDATE ... WHERE 등) 으로 처리하기 어려운 복잡한choiwonjin.tistory.com이번에는 파이썬과 MySQL을 연동해서 커서(Cursor)를 사용하는 방법에 대해 알아보자.아래 그림은 파이썬에서의 DB 연동 흐름이다.1. 준비: pymysql 설치pip install pymysql 2. 기본 연결 흐름import pymysql# 1) 커넥션 생성host = 'localhost' .. 더보기
[Python] 이커머스 데이터 퍼널 분석(Funnel Analysis) 퍼널 분석(Funnel Analysis)사용자가 특정 목표(예: 구매 완료)에 도달하는 과정에서 각 단계별로 얼마나 많은 사용자가 이탈하는지를 분석하는 방법론사용자가 어디에서 이탈하는지 파악하는 데 도움이 되며, 그 이유를 이해하여 이탈률을 줄이고 전환율을 높일 수 있는 장점이 있다.0. 패키지 및 데이터 로드import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltdf = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/퍼널 분석/user_data.csv')dfstage: 각 단계conversion: 해당 단계의 다음 단계로 넘어가는지 여부1. 전환율(Conversion Rat.. 더보기
[Python] 이커머스 고객 세분화 분석 (RFM, 코호트 분석) RFM 분석고객의 구매 행동을 기반으로 충성도 높은 고객을 식별하고 마케팅 전략을 최적화하는 데 사용되는 데이터 분석 기법 RFM 분석의 세 가지 요소Recency (최신성): 고객이 마지막으로 구매한 날짜 (최근 구매일)Frequency (빈도): 고객이 특정 기간 동안 몇 번 구매했는지 (구매 횟수)Monetary (금액): 고객이 특정 기간 동안 총 얼마를 소비했는지 (구매 금액)0. 패키지 불러오기import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.font_manager as fmimport datetime as dt1. 데이터 로드 및 전처리(1) 데이터 로.. 더보기
[Python] 결측치 보간법 (1/2차 선형보간법, 평균대치법, KNN, MICE) 데이콘의 결측치 보간 챌린지 데이터를 사용하여 결측치를 보간하는 여러 가지 방법에 대해 알아보겠습니다.# 패키지 세팅import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.impute import SimpleImputer, KNNImputerfrom sklearn.experimental import enable_iterative_imputerfrom sklearn.impute import IterativeImputer # 데이터 로드data = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/공모전/data.csv')df = .. 더보기
[Python] 이상치 탐지 기법 (IQR, Isolation Forest, rolling 함수, decompose 패키지) 이상치란?전체 데이터의 대부분의 패턴, 범위에서 크게 벗어난 값인데 아주 작은 값일 수 있고, 아주 큰 값일 수 있습니다. 이상치를 중요하게 바라봐야 하는 이유는?극단적인 값으로 인해 통계치 또는 ML 학습에서 영향을 받게 되기 때문입니다. 도메인의 영향이상치는 도메인에 따라, 이상치 탐지 기법에 따라 다를 수 있기 때문에 도메인의 영향을 받습니다.이번 포스팅에서는 임의로 이상치가 포함된 데이터셋을 만들고, 여러 방법을 사용한 이상치 탐지 기법을 알아보겠습니다.먼저 이상치 탐지에 필요한 패키지를 로드합니다.import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 이상치 탐지 방법 from sk.. 더보기

반응형