본문 바로가기

인공지능/Python

Pandas

728x90
반응형

pandas

Prerequisite : Table

  • 행과 열을 이용해서 데이터를 저장하고 관리하는 자료구조(컨테이너)
  • 주로 행은 개체, 열은 속성

Pandas 시작하기

import pandas를 통해서 진행
import pandas as pd

Pandas로 1차원 데이터 다루기 - Series

Series

  • 1-D labeled array
  • 인덱스를 지정해줄 수 있음

Series + Numpy

  • Series는 ndarray와 유사하다

Series + dict

  • series는 dict와 유사하다

Series에 이름 붙이기

  • name 속성을 가지고 있다.
  • 처음 Series를 만들 때 이름을 붙일 수 있다.

Datafrane

  • 2-D labeled table

From CSV to dataframe

  • csv를 DataFrame으로 생성해줄 수 있다.
  • read_csv()를 이용

covid-19 dataset
head(), tail()
행, 슬라이싱
조건에 맞는 데이터 찾기
인덱스 이용 loc(), iloc()

Groupby

  • Split: 특정한 기준을 바탕으로 DataFrame을 분할
  • Apply: 통계한수 - sum(), mean(), median(), ...을 적용해서 각 데이터를 압축
  • Combine: Aplly된 결과를 바탕으로 새로운 Series를 생성 (group_key : applied_value)

groupby()

728x90
반응형

'인공지능 > Python' 카테고리의 다른 글

Matplotlib  (0) 2020.12.16
Numpy 연산  (0) 2020.12.14
인공지능 교육 3일차  (0) 2020.12.03
인공지능 교육 2일차  (0) 2020.12.02