Pandas 라이브러리
- 데이터 분석 및 조작을 위한 라이브러리
- 데이터 분석을 위한 효율적인 데이터 구조 제공, 1차원 배열 형태의 데이터 구조인 Series 와 2차원 배열 형태의 데이터 구조인 Data Frame 제공
특징
- DataFrame 구조의 라이브러리로 가장 범용적으로 사용(엑셀의 Sheet와 유사)
- 엑셀의 스프레드 시트와 유사한 형태
- 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터 제공
- 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조
- 누락된 데이터 유연하게 처리할 수 있는 기능 제공
- SQL 같은 RDB 처럼 데이터 JOIN, 관계 연산 수행 가능
- 파이썬 기본 내장 라이브러리 X -> 별도의 설치 필요 (아나콘다 사용 시 내장됨)
- IDLE 사용 시 콘솔에서 pip install xxx로 인스톨 가능
- 라이브러리 추가 방법
import pandas as pd
자료형
- Series : 시트의 1열 의미
- 1차원 배열 형태의 데이터 구조 사용
- 가로 방향으로 크기 변경
- 인덱스 추가 가능