python

16편 Python 기초 문법: 데이터 시각화

파이썬 티쳐 2024. 11. 20. 09:48

1. 데이터 시각화의 기본 개념

1.1 데이터 시각화란 무엇인가

데이터 시각화는 데이터를 그래프나 차트 같은 시각적 형태로 표현하여 복잡한 데이터를 쉽게 이해할 수 있도록 돕는 과정입니다.

1.3 Python에서 사용할 수 있는 시각화 도구들

  • matplotlib: Python의 기본적인 시각화 라이브러리로 다양한 그래프와 차트를 생성할 수 있습니다.
  • seaborn: matplotlib 기반의 라이브러리로, 통계적 그래프를 쉽게 그릴 수 있도록 지원합니다.

2. matplotlib을 사용한 데이터 시각화

2.1 matplotlib 라이브러리 설치 및 기본 사용법

pip install matplotlib
import matplotlib.pyplot as plt

# 데이터 준비
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]

# 선 그래프 그리기
plt.plot(x, y)
plt.show()

2.2 기본적인 선 그래프, 막대 그래프 그리기

선 그래프:

plt.plot(x, y)
plt.title("선 그래프")
plt.xlabel("X축 레이블")
plt.ylabel("Y축 레이블")
plt.show()

막대 그래프:

categories = ['A', 'B', 'C', 'D']
values = [10, 24, 36, 40]

plt.bar(categories, values)
plt.title("막대 그래프")
plt.show()

2.4 그래프 스타일과 색상 변경

# 파란색 점선으로 그래프 그리기
plt.plot(x, y, 'b--', label="제곱수")

# 그래프 스타일 추가
plt.title("X와 Y의 관계")
plt.xlabel("X값")
plt.ylabel("Y값")
plt.legend()

plt.show()

3. 데이터 시각화를 활용한 프로그램

3.1 간단한 데이터 분석 후 그래프 출력하기 (학생 성적 분포 그래프)

학생들의 성적 데이터를 분석하고, 분포를 막대 그래프로 시각화하는 프로그램입니다.

import matplotlib.pyplot as plt

# 학생 성적 데이터
grades = [85, 90, 75, 80, 95, 70, 60, 88, 92, 76]
bins = [60, 70, 80, 90, 100]

# 히스토그램 생성
plt.hist(grades, bins=bins, edgecolor='black')

# 그래프 제목과 축 레이블 추가
plt.title("학생 성적 분포")
plt.xlabel("점수")
plt.ylabel("학생 수")

plt.show()

3.2 웹 크롤링 데이터를 시각화하여 트렌드 분석 프로그램 만들기

웹 크롤링을 통해 얻은 데이터를 시각화하여 트렌드를 분석할 수 있습니다.

import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt

# 웹 크롤링을 통한 데이터 수집 (예시)
dates = ['2024-10-01', '2024-10-02', '2024-10-03', '2024-10-04']
search_volumes = [120, 180, 150, 200]

# 선 그래프로 트렌드 시각화
plt.plot(dates, search_volumes, marker='o')

# 그래프 제목과 축 레이블 추가
plt.title("키워드 검색 트렌드")
plt.xlabel("날짜")
plt.ylabel("검색량")

plt.show()