5 파이썬 데이터 분석 입문 : 1탄 (윈도우·CSV 불러오기 기초편)
“엑셀은 아는데 파이썬은 처음이에요…” 라는 분들을 위한
데이터 분석 입문편입니다 😊
이 글에서는 윈도우 기준으로
엑셀에서 만든 CSV 파일을 파이썬으로 불러오는 방법을 아주
기초부터 차근차근 설명드릴게요.
이 글은 “파이썬 기초 시리즈” 중 5편: 데이터 분석 입문 (윈도우·CSV 편)입니다.
1. 오늘 목표: 엑셀표를 파이썬으로 불러오기
오늘의 목표는 복잡하지 않습니다. 딱 한 줄로 정리하면 이거예요 👇
“엑셀로 만든 점수표(CSV)를 파이썬(pandas)으로 읽어서 화면에 보여주기”
이 경험을 한 번만 해보면,
- CSV 파일이 뭔지
.py파일이 뭔지cmd창이 왜 필요한지
이 세 가지가 한 번에 연결돼서 이해되기 시작합니다 ✨
2. 등장인물 세 명 정리: CSV, .py, cmd
처음 보시는 분들을 위해, 앞으로 자주 만날 세 가지 개념만 먼저 정리하고 갈게요.
- CSV 파일 – 엑셀에서 “다른 이름으로 저장 → CSV(쉼표로 분리)”로 저장한 파일. 데이터(표)가 담긴 파일입니다.
- .py 파일 – 파이썬 코드(명령)를 적어 두는 파일. “이 CSV를 읽어서 보여줘!” 같은 작업 지시서라고 생각하면 돼요.
- cmd (명령 프롬프트) – 윈도우에 기본으로 있는 검은 창. 마우스 대신 글자로 컴퓨터에게 명령을 보내는 창입니다.
오늘은 CSV(데이터) + .py(명령서) + cmd(명령 전달 창) 이 세 가지가 함께 움직이도록 만들어 볼 거예요.
3. 엑셀에서 CSV 파일 만들기
먼저 엑셀에서 간단한 성적표를 만들어 봅니다.
- A1: 이름, B1: 국어, C1: 영어, D1: 수학
- 아래에 철수·영희·민수 점수를 입력
이름,국어,영어,수학 철수,90,85,80 영희,100,95,90 민수,70,88,92
위와 같은 내용이 들어간 표라고 생각하시면 됩니다.
CSV로 저장하는 순서
- 엑셀 상단에서 [파일] → [다른 이름으로 저장] 클릭
- 폴더 위치를 C:\python_practice 로 선택 (없으면 새 폴더 만들기)
- 파일 이름:
scores.csv - 파일 형식에서 “CSV(쉼표로 분리)” 또는 “CSV UTF-8(쉼표로 분리)” 선택
- 저장 후 엑셀은 잠시 닫아두기
C:\python_practice 라는 폴더를 만들고,
그 안에 scores.csv를 저장해 둡니다. 앞으로 파이썬 코드는 이
파일을 읽어올 거예요.
4. 파이썬과 pandas 준비 상태 확인하기
이제 파이썬이 잘 설치되었는지, 데이터 분석 도구인 pandas를 쓸 수 있는지 확인해 볼게요.
① cmd(명령 프롬프트) 열기
- 윈도우 왼쪽 아래 검색창에
cmd입력 - 검색 결과에서 “명령 프롬프트” 클릭
검은색 창이 하나 뜨면 성공입니다.
② 파이썬 설치 확인
python --version
위 명령을 입력하고 엔터를 치면,
Python 3.x.x
처럼 버전이 뜨면 잘 설치된 거예요.
③ pandas 설치
같은 창에서 아래 명령을 입력합니다.
pip install pandas
설치가 잘 되면 중간에 여러 글자가 지나가고 마지막에
Successfully installed pandas 비슷한 문장이 보입니다.
import pandas as pd를 써서 언제든지 pandas를 사용할 수 있어요.
5. 파이썬 코드(.py) 파일 만들어 보기
이제 파이썬에게 “scores.csv 파일을 읽어서 화면에 보여줘”라는 명령서를 만들어 볼게요.
① 메모장 열기
- 시작 메뉴에서 메모장 검색 → 실행
- 아래 코드를 그대로 붙여넣기
import pandas as pd
# 1) CSV 파일을 불러옵니다.
df = pd.read_csv("C:/python_practice/scores.csv", encoding="cp949")
# 2) 내용을 화면에 출력합니다.
print(df)
여기서 encoding="cp949"는
한글이 깨지지 않도록 도와주는 옵션입니다. (윈도우에서 만든
CSV 파일은 이 인코딩을 쓰는 경우가 많아요)
② .py 파일로 저장하기
- 메모장 상단 메뉴에서 [파일] → [다른 이름으로 저장] 클릭
- 폴더를 C:\python_practice로 선택
-
파일 이름을
read_csv_test.py로 입력 - 파일 형식은 “모든 파일” 또는 기본값 그대로 두고 저장
이제 폴더 안 구조는 이렇게 됩니다.
C:\python_practice ├─ scores.csv └─ read_csv_test.py
scores.csv = 데이터가 들어 있는 엑셀표,
read_csv_test.py = “이 표를 읽어서 출력하라”는 파이썬
명령서입니다.
6. cmd에서 파이썬 코드 실행하기
이제 마지막 한 발짝만 남았습니다. 방금 만든 명령서를 실제로 “읽어 달라”고 시켜볼게요.
① 파일이 있는 폴더로 이동
다시 cmd 창에서 아래 명령을 입력합니다.
cd C:\python_practice
이제 프롬프트 앞쪽이 이런 모습이면 성공이에요.
C:\python_practice>
② 파이썬으로 실행
같은 창에서 아래 한 줄을 입력합니다.
python read_csv_test.py
그리고 엔터를 치면…
이름 국어 영어 수학 0 철수 90 85 80 1 영희 100 95 90 2 민수 70 88 92>
이렇게 결과가 출력됩니다 🎉 이 순간, 파이썬이 scores.csv에 있는
엑셀표를 정말로 읽어와서 보여준 거예요.
python 파일이름.py는 “파이썬 프로그램아,
이 명령서를 읽고 실행해 줘!”라는 뜻입니다. cmd는 우리가 이 말을 할 수 있는
“명령 창”이에요.
7. 자주 나오는 문제와 빠른 해결법
① No such file or directory: 'scores.csv'
파이썬이 scores.csv를 못 찾겠다는 뜻입니다.
-
실제로
C:\python_practice안에scores.csv가 있는지 확인 - 경로를 잘못 쓴 경우: 코드에서 파일 경로가 실제 위치와 같은지 체크
② 한글이 깨져 보일 때
- 코드에서
encoding="cp949"를 넣었는지 확인 -
엑셀에서 CSV UTF-8로 저장했다면
encoding="utf-8"로 바꿔 보기
③ cmd에서 python 입력 시 인식이 안 될 때
- 파이썬 설치 시 Add Python to PATH를 체크하지 않았을 수 있어요.
- 이 경우 파이썬을 다시 설치하면서 해당 옵션을 체크하고 설치하면 됩니다.
8. 다음 단계: 합계·평균·len()으로 진짜 “분석” 시작하기
여기까지 따라오셨다면, 이미 큰 산을 하나 넘으신 거예요 👏 데이터 분석의 시작은 바로 “데이터를 잘 불러오는 것”이니까요.
이제 다음 글에서는 방금 불러온 df를 가지고
- 국어/영어/수학 과목별 평균 구하기
- 학생별 총점, 평균 컬럼 추가하기
len()함수로 “몇 명인지 자동으로 세기”
같은 예제를 하나씩 직접 타이핑하면서 연습해 볼 거예요. “눈으로 읽는 코딩”이 아니라, “손으로 쳐보는 코딩”을 같이 해볼게요 😊