데이터 분석

데이터프레임과 시리즈 차이(+ 파이썬, 데이터 분석)

The Ohgorithm 2025. 10. 12. 21:59

Series(시리즈)와 DataFrame(데이터프레임)의 차이를 직관적으로 이해할 수 있게 코드랑 함께 단계별로 설명해드릴게요.


🧩 1️⃣ 기본 개념부터

구분                Series                                                  DataFrame
구조 1차원 (열 1개) 2차원 (행 + 여러 열)
모양 리스트처럼 생김 표처럼 생김
예시 이름만 담긴 리스트 이름 + 나이 + 성별 등 여러 정보가 담긴 표

🧪 2️⃣ 예제 코드로 보기

 
import pandas as pd

# 예시 데이터
data = {
    '이름': ['김민수', '이지은', '박철수'],
    '나이': [25, 30, 27],
    '성별': ['남', '여', '남']
}

df = pd.DataFrame(data)
print(df)
 
 
출력:
 
     이름  나이 성별
0   김민수  25  남
1   이지은  30  여
2   박철수  27  남

🧩 3️⃣ Series (시리즈) 예시

 
# '이름' 열만 선택 (대괄호 한 개)
name_series = df['이름']
print(name_series)
 
 

출력:

 
0    김민수
1    이지은
2    박철수
Name: 이름, dtype: object
 
 

특징 정리

  • 단 하나의 열만 선택했기 때문에 1차원 데이터
  • 리스트처럼 다룰 수 있음
  • 형태(shape):
  •  
    print(name_series.shape)
    # (3,)
  •  
  • 데이터 타입(type):
  •  
    print(type(name_series))
    # <class 'pandas.core.series.Series'>

🧩 4️⃣ DataFrame (데이터프레임) 예시

 
# '이름' 열만 DataFrame 형태로 선택 (대괄호 두 개)
name_df = df[['이름']]
print(name_df)
 
 

출력:

 
     이름
0   김민수
1   이지은
2   박철수
 
 

특징 정리

  • 여전히 표 형태(2차원)
  • 열이 1개여도 DataFrame은 “테이블” 구조 유지
  • 형태(shape):
  •  
    print(name_df.shape)
    # (3, 1)
  • 데이터 타입(type):
  •  
    print(type(name_df))
    # <class 'pandas.core.frame.DataFrame'>

🧩 5️⃣ 두 형태의 차이 한눈에 보기

구분                                           Series (df['이름'])                        DataFrame (df[['이름']])

 

구조 1차원 2차원
형태(shape) (3,) (3, 1)
출력 형태 리스트처럼 표처럼
타입 pandas.Series pandas.DataFrame
활용 예 평균, 합계, 그래프 열 여러 개 결합, 머신러닝 입력 등

🧠 6️⃣ 쉽게 비유하자면

  • Series → 엑셀 한 칸짜리 세로 줄 (열 하나만 뽑은 리스트)
  • DataFrame → 엑셀 전체 표 (열 여러 개가 있는 표 구조)

✅ 7️⃣ 정리

 
# Series: 1차원
df['이름']

# DataFrame: 2차원
df[['이름']]

📌 요약 한 줄:
df['이름']은 한 줄짜리 리스트,
df[['이름']]은 표 형태의 테이블 한 칸입니다.