We are Architect

33. 파이썬을 이용한 데이터 시각화 프로그램 만드는 법 본문

Programing/Python

33. 파이썬을 이용한 데이터 시각화 프로그램 만드는 법

the best infra 2024. 12. 8. 19:08

 

* 취지 : 

  • csv 즉 행과 열로 이루어진 파일에 대한 값들을 그래프로 나타내면 어떨까 하는 궁금증이 생겼다. 그래서 보니까 간단하고 쉽게 만들 수 있을 거 같아서 만들어 봤다.

 

 

* 코드 설계 

  1. 데이터 파일 추출 
  2. 데이터 파일에서 행에 있는 데이터 출력
  3. 행에 있는 데이터 그래프의 X축 Y축으로 선택
  4. 그래프 그리기 

 

 

* 사용된 도구들 

  • pandas : 행과 열로 구성된 데이터를 처리할 수 있도록 지원하는 라이브러리.
  • matplotlib.pyplot : 데이터를 시각화 하기 위한 파이썬 그래프 생성 함수 라이브러리

 

 

* 그래프를 만들기 위한 데이터

 

 

* 가져온 라이브러리 및 모듈

# 행과 열로 구성된 데이터를 처리할 수 있도록 지원하는 라이브러리.
import pandas as pd
# 데이터를 시각화 하기 위한 파이썬 라이브러리.(pyplot는 함수 모음집)
import matplotlib.pyplot as plt

 

 

* 함수

def data_visualization():
    # 사용자로부터 CSV 파일 경로 입력받기.
    file_path = input("CSV 파일 경로를 입력하세요 > ")

    try:
        # CSV 파일 읽기(행과 열로 된 표 형태를 다룰수 있게함.지정한 경로에 있는 파일을 읽을수 있음.)
        data = pd.read_csv(file_path)

        # 데이터 확인(head 함수로 부터 data안에 있는 데이터 출력)
        print("\n데이터 미리보기")
        print(data.head())

        # 사용자로부터 X축과 Y축 선택
        print("\n데이터 컬럼 목록:")
        # data에서 사용가능한 열 이름 출력.
        print(data.columns)
        x_col = input("X축에 사용할 컬럼 이름을 입력하세요 : ")
        y_col = input("Y축에 사용할 컬럼 이름을 입력하세요 : ")

        # 그래프 그리기 > line, bar, scatter
        # data.plot()함수는 선택한 X축과 Y축을 사용하여 그래프를 그림.
        # kind는 시각화 형식, title은 제목.
        data.plot(x=x_col, y=y_col, kind='bar', title="Data Visualization")
        plt.xlabel(x_col)
        plt.ylabel(y_col)

        # 그래프에 격자를 추가하여 데이터를 읽기 쉽게 만듦.
        plt.grid(True)

        # 그래프를 화면에 표시하는 함수, 해당 함수 호출 전까진 그래프 출력되지 않음.
        plt.show()

    # 오류 처리 클래스
    except Exception as e:
        print(f"오류 발생: {e}")

 

 

* 함수 실행

data_visualization()

 

 

* 실행 결과

그래프를 생성하기 위한 설정
생성된 bar 그래프