python
16편 Python 기초 문법: 데이터 시각화
파이썬 티쳐
2024. 11. 20. 09:48
1. 데이터 시각화의 기본 개념
1.1 데이터 시각화란 무엇인가
데이터 시각화는 데이터를 그래프나 차트 같은 시각적 형태로 표현하여 복잡한 데이터를 쉽게 이해할 수 있도록 돕는 과정입니다.
1.3 Python에서 사용할 수 있는 시각화 도구들
- matplotlib: Python의 기본적인 시각화 라이브러리로 다양한 그래프와 차트를 생성할 수 있습니다.
- seaborn: matplotlib 기반의 라이브러리로, 통계적 그래프를 쉽게 그릴 수 있도록 지원합니다.
2. matplotlib을 사용한 데이터 시각화
2.1 matplotlib 라이브러리 설치 및 기본 사용법
pip install matplotlib
import matplotlib.pyplot as plt
# 데이터 준비
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
# 선 그래프 그리기
plt.plot(x, y)
plt.show()
2.2 기본적인 선 그래프, 막대 그래프 그리기
선 그래프:
plt.plot(x, y)
plt.title("선 그래프")
plt.xlabel("X축 레이블")
plt.ylabel("Y축 레이블")
plt.show()
막대 그래프:
categories = ['A', 'B', 'C', 'D']
values = [10, 24, 36, 40]
plt.bar(categories, values)
plt.title("막대 그래프")
plt.show()
2.4 그래프 스타일과 색상 변경
# 파란색 점선으로 그래프 그리기
plt.plot(x, y, 'b--', label="제곱수")
# 그래프 스타일 추가
plt.title("X와 Y의 관계")
plt.xlabel("X값")
plt.ylabel("Y값")
plt.legend()
plt.show()
3. 데이터 시각화를 활용한 프로그램
3.1 간단한 데이터 분석 후 그래프 출력하기 (학생 성적 분포 그래프)
학생들의 성적 데이터를 분석하고, 분포를 막대 그래프로 시각화하는 프로그램입니다.
import matplotlib.pyplot as plt
# 학생 성적 데이터
grades = [85, 90, 75, 80, 95, 70, 60, 88, 92, 76]
bins = [60, 70, 80, 90, 100]
# 히스토그램 생성
plt.hist(grades, bins=bins, edgecolor='black')
# 그래프 제목과 축 레이블 추가
plt.title("학생 성적 분포")
plt.xlabel("점수")
plt.ylabel("학생 수")
plt.show()
3.2 웹 크롤링 데이터를 시각화하여 트렌드 분석 프로그램 만들기
웹 크롤링을 통해 얻은 데이터를 시각화하여 트렌드를 분석할 수 있습니다.
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt
# 웹 크롤링을 통한 데이터 수집 (예시)
dates = ['2024-10-01', '2024-10-02', '2024-10-03', '2024-10-04']
search_volumes = [120, 180, 150, 200]
# 선 그래프로 트렌드 시각화
plt.plot(dates, search_volumes, marker='o')
# 그래프 제목과 축 레이블 추가
plt.title("키워드 검색 트렌드")
plt.xlabel("날짜")
plt.ylabel("검색량")
plt.show()