분류 전체보기 50

UserWarning: X has feature names 경고 해결법 — StandardScaler 사용 시 꼭 알아야 할 포인트

두 코드의 차이는 StandardScaler 인스턴스를 재사용하느냐, 새로 생성하느냐에 있어요.이 차이 때문에 "UserWarning: X has feature names, but StandardScaler was fitted without feature names" 경고가 발생합니다.🔍 1️⃣ 정상 작동하는 코드 ss = StandardScaler() X_train = ss.fit_transform(X_train) X_test = ss.transform(X_valid) ss라는 하나의 인스턴스를 만들어 fit → transform 순서로 사용합니다.fit 시점에 X_train의 feature names(컬럼명) 이 함께 저장됩니다.이후 transform(X_valid)을 호출할 때 같은 인스턴스이므로..

데이터 분석 2025.10.16

Boxplot 예시를 통해 설명(+ 장바구니 이탈 여부 예측 문제)

다음 중 옳은 것을 고르시오.1. registered 사용자가 guest보다 평균과 중앙값 모두 높고 이상치도 많다.2. guest 사용자는 registered 보다 체류 시간이 약간 더 길며, 평균과 중앙값 모두 더 높다.3. 두 그룹의 중앙값은 같지만, guest는 이상치가 많아 평균만 더 높다.4. guest는 이상치가 없고 registered는 이상치로 인해 중앙값이 낮아졌다. ________________________________________________________________________________________________✅ 2번이 옳습니다.2. guest 사용자는 registered 보다 체류 시간이 약간 더 길며, 평균과 중앙값 모두 더 높다.그래프에서 **guest..

데이터 분석 2025.10.15

데이터프레임과 시리즈 차이(+ 파이썬, 데이터 분석)

Series(시리즈)와 DataFrame(데이터프레임)의 차이를 직관적으로 이해할 수 있게 코드랑 함께 단계별로 설명해드릴게요.🧩 1️⃣ 기본 개념부터구분 Series DataFrame구조1차원 (열 1개)2차원 (행 + 여러 열)모양리스트처럼 생김표처럼 생김예시이름만 담긴 리스트이름 + 나이 + 성별 등 여러 정보가 담긴 표🧪 2️⃣ 예제 코드로 보기 import pandas as pd # 예시 데이터 data = { '이름': ['김민수', '이지은', '박철수'], '나이': [25, 30, 27], '성별': ['남', '여', '남'] } df = pd.Da..

데이터 분석 2025.10.12

데이터프레임 괄호 2개와 괄호 1개 차이(+ 데이터프레임과 시리즈 차이)

df['이름']과 df[['이름']]은 겉보기엔 비슷하지만 리턴 타입이 다릅니다.쉽게 말하면, 전자는 “시리즈(Series)”, **후자는 “데이터프레임(DataFrame)”**이에요.✅ 1️⃣ df['이름'] → Series (열 하나만 선택)하나의 열(column) 을 선택해서 시리즈 형태로 가져옵니다.즉, 1차원 데이터예요.인덱스(행 번호)는 유지되지만, 열 이름이 사라집니다. df['이름'] 결과 예시: 0 김민수 1 이지은 2 박철수 Name: 이름, dtype: object ➡️ 결과가 Series이기 때문에 .shape 하면 (3,) 처럼 나와요.➡️ 다른 열과 함께 쓰려면 DataFrame 형태로 다시 바꿔야 합니다 (.to_frame()).✅ 2️⃣ df[['이름']] → DataFram..

데이터 분석 2025.10.11

선형회귀 Linear Regression(+ 선형회귀 원리, 패키지 설치 명령어, 터미널/노트북 셀 명령어, 라이브러리 임포트 코드)

선형회귀 원리: https://setosa.io/ev/ordinary-least-squares-regression/ Ordinary Least Squares Regression explained visuallyFor more explanations, visit the Explained Visually project homepage. Or subscribe to our mailing list.setosa.io pip install scikit-learn --upgrade --user -q import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression..

데이터 분석 2025.10.02

덱 Deque을 큐처럼 활용하기(+ 파이썬)

덱은 Double Ended Queue를 줄인 말이다.양 끝에서 삽입이나 삭제할 수 있는 큐를 구현한 것이다.양 끝에서 삽입이나 삭제를 할 수 있다는 특징 때문에 큐를 구현할 때는 덱을 사용하는 것이 좋다. from collections import deque # 파이썬에서 큐를 쉽게 구현할 수 있는 deque 클래스 가져오기 queue = deque() # 빈 큐 생성 queue.append(1) # 큐에 1 삽입 → [1] queue.append(2) # 큐에 2 삽입 → [1, 2] queue.append(3) # 큐에 3 삽입 → [1,..