본문 바로가기

전체 글

(43)
[MYSQL] GROUP BY https://school.programmers.co.kr/learn/courses/30/lessons/131536 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr SELECT USER_ID, PRODUCT_IDFROM ONLINE_SALE GROUP BY USER_ID, PRODUCT_IDHAVING COUNT(USER_ID) >= 2ORDER BY USER_ID, PRODUCT_ID DESC GROUP BY를 이용해 USER_ID와 PRODUCT_ID 별로 그룹화 한다. 즉, 각 사용자와 그 사용자가 구매한 각 상품의 조합으로 그룹을 만든다.HAVING 절..
[R] diamonds dataset 분석 프로젝트 R의 내장 데이터셋인 diamonds 데이터를 기반으로 하여 가설을 세우고 분석하는 프로젝트를 진행했습니다.먼저 diamonds 데이터셋 소개를 하겠습니다.diamonds 데이터셋은 ggplot2 패키지에 속해 있습니다.library(ggplot2)diamonds = as.data.frame(diamonds)dim(diamonds)head(diamonds)str(diamonds)summary(diamonds)총 53940개의 관측치, 10개의 변수로 구성되어 있는 것을 알 수 있습니다.총 10개의 변수 중 문자형 변수와 숫자형 변수는 각각 3개, 7개입니다. 이번 프로젝트에서 설정한 가설은 총 3개로 다음과 같습니다.다이아몬드의 가격 분포는 시각적 특성(cut, color, clarity)에 따라 다르게..
[Python] 결측치 보간법 (1/2차 선형보간법, 평균대치법, KNN, MICE) 데이콘의 결측치 보간 챌린지 데이터를 사용하여 결측치를 보간하는 여러 가지 방법에 대해 알아보겠습니다.# 패키지 세팅import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.impute import SimpleImputer, KNNImputerfrom sklearn.experimental import enable_iterative_imputerfrom sklearn.impute import IterativeImputer # 데이터 로드data = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/공모전/data.csv')df = ..
[Flutter 완벽 정리] Flutter SDK 설치 방법, android toolchain 오류 해결하기, Android studio, VS code, Dart, 어플 만들기, hello world 출력하기 Flutter를 설치하고 VS Code로 실행하는 방법을 알아보겠습니다.1.  Flutter SDK 다운로드 https://docs.flutter.dev/get-started/install/windows/desktop?tab=download위 링크로 접속하고 Zip 파일을 다운받아 압축을 푼다. 그리고 윈도우 환경 변수에 flutter SDK 위치를 추가해 플러터 명령 실행을 위한 환경을 만들어준다.시스템 환경 변수 편집 -> 고급 -> 환경 변수Path에 Flutter SDK 디렉토리 위치를 추가한다. (path 선택 후 편집 클릭)빈 칸을 더블클릭 한 후 압축을 푼 Flutter 파일의 경로를 붙여넣기 한다.2.  Android Studio 설치 https://developer.android.com/..
[Python] 이상치 탐지 기법 (IQR, Isolation Forest, rolling 함수, decompose 패키지) 이상치란?전체 데이터의 대부분의 패턴, 범위에서 크게 벗어난 값인데 아주 작은 값일 수 있고, 아주 큰 값일 수 있습니다. 이상치를 중요하게 바라봐야 하는 이유는?극단적인 값으로 인해 통계치 또는 ML 학습에서 영향을 받게 되기 때문입니다. 도메인의 영향이상치는 도메인에 따라, 이상치 탐지 기법에 따라 다를 수 있기 때문에 도메인의 영향을 받습니다.이번 포스팅에서는 임의로 이상치가 포함된 데이터셋을 만들고, 여러 방법을 사용한 이상치 탐지 기법을 알아보겠습니다.먼저 이상치 탐지에 필요한 패키지를 로드합니다.import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 이상치 탐지 방법 from sk..
[SQL] SQL쿼리 (8) QUARTER 함수 https://school.programmers.co.kr/learn/courses/30/lessons/299308 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr SELECT CONCAT(QUARTER(DIFFERENTIATION_DATE), 'Q') AS QUARTER, COUNT(*) AS ECOLI_COUNTFROM ECOLI_DATAGROUP BY QUARTERORDER BY QUARTER - 실행 결과 QUARTERECOLI_COUNT1Q22Q23Q14Q1 QUARTER 함수를 이용해 날짜 별로 분기를 나누고,나눠진 분기 별로 그룹화 한 후,각 그룹..
[SQL] SQL 쿼리 (7) (1) Python 개발자 찾기https://school.programmers.co.kr/learn/courses/30/lessons/276013 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.krSELECT ID, EMAIL, FIRST_NAME, LAST_NAMEFROM DEVELOPER_INFOSWHERE 'Python' in (SKILL_1, SKILL_2, SKILL_3)ORDER BY ID  (2) 잡은 물고기의 평균 길이 구하기https://school.programmers.co.kr/learn/courses/30/lessons/293259 프로그래머..
[R] 다변량 자료 분석 (2) : Hotelling T^2 검정 저번 포스팅에서 전처리를 했던 airquality 데이터로 통계 분석을 하겠습니다. 1. 기본 데이터 세팅airquality = na.omit(airquality)airquality$season = ifelse(airquality$Month == 5 | airquality$Month == 9, "non-summer", "su..