카테고리 없음

데이터 분석 라이브러리

SigLee0505 2024. 8. 26. 12:29

Pandas 라이브러리

  • 데이터 분석 및 조작을 위한 라이브러리
  • 데이터 분석을 위한 효율적인 데이터 구조 제공, 1차원 배열 형태의 데이터 구조인 Series 와 2차원 배열 형태의 데이터 구조인 Data Frame 제공

특징

  • DataFrame 구조의 라이브러리로 가장 범용적으로 사용(엑셀의 Sheet와 유사)
  • 엑셀의 스프레드 시트와 유사한 형태
  • 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터 제공
  • 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조
  • 누락된 데이터 유연하게 처리할 수 있는 기능 제공
  • SQL 같은 RDB 처럼 데이터 JOIN, 관계 연산 수행 가능
  • 파이썬 기본 내장 라이브러리 X -> 별도의 설치 필요 (아나콘다 사용 시 내장됨)
    • IDLE 사용 시 콘솔에서 pip install xxx로 인스톨 가능
  • 라이브러리 추가 방법
    • import pandas as pd

자료형

  • Series : 시트의 1열 의미
  • 1차원 배열 형태의 데이터 구조 사용
  • 가로 방향으로 크기 변경
  • 인덱스 추가 가능