본문 바로가기
파이썬

[파이썬] 파이썬으로 pandas 모듈 공부하기

by 딩박사 2021. 6. 2.
반응형

* 본 포스팅은 한국품질재단 취업지원센터에서 주최하는 혁신성장 청년인재 집중 양성사업(인공지능)에서 학습한 내용을 포스팅합니다.


  •  파이썬 진영에서 R에 대응해서 만든 데이터 분석(Analysis) 라이브러리(패키지)
    • R↔pandas, scikit-learn(머신러닝), matplotlib, 기타(필요시)
  • numpy를 기반으로 구현되었다
  • 자료구조
    • Series
    • DataFrame

모듈 가져오기

import numpy as np
import pandas as pd

기본 생성

- Series

1. 자료구조이며, 2개의 성분을 가진다.( 데이터(필수) + 인덱스 정보(옵션) )

2. 1차원이며, 데이터만 넣고 생성한다

3. 인덱스 정보를 넣지 않을 시 자동부여(np.nan : 결측치, 결측 데이터)

a = pd.Series( [1,2,3,np.nan, 6, 8])
a

- DataFrame

1. 3개의 성분을 가진다.( 데이터(필수) + 인덱스(옵션) + 칼럼(옵션) )

2. 2차원이며, DataFrame(2d)을 인덱싱(차원 축소)하면 → Series(1d)

# 재료
# 1. 데이터
datas  = np.random.randn( 7,4 )
# 2. 인덱스 -> 가로기준,row => 7 
indexs = pd.date_range('20210517', periods=7)
# 3. 컬럼 -> 세로 기준, col => 4
cols   = list('ABCD')
datas, indexs, cols

# DataFrame 생성
df = pd.DataFrame( datas, index=indexs, columns=cols )
df

》 위 그림과 같이 datas는 데이터로, indexs는 DataFrame의 가로로, cols는 DataFrame의 세로로 생성되었다.

반응형

댓글