언어공부/python

[Python] Numpy와 Pandas 왜 둘 다 배워..?

기싼 2022. 10. 5. 22:05

솔직히 csv읽어오고 데이터 전처리시 data frame만 사용하는거 같은데 왜 둘다 배움..?

.

.

 

 pandas로 불러온 data frame에서 values로 계산 작업할때 결과물이 모두 numpy라서 numpy도 필요해

 

 


NumPy

 

특징

  • N-demension의 Matrix에 대해 연산이 가능해!!
  • Matrix내의 모든 원소는 같은 데이터 타입이어야만 해!!
  • 난수 생성이 가능해
  • 선형대수학에서 배운 내용들을 적용하기가 쉽다!

 


Pandas

 

특징

  • csv와 같은 데이터 파일을 불러올때 종종 쓰여!
  • SQL처럼 데이터에 대해 질의를 할수 있어
  • col 별로 데이터 타입이 달라도 괜찮아!!
  • 2차원 데이터만 사용이 가능해! ( n차원 이상에서는 사용이 불가능해.. excel이 3차원으로 나오진 않잖아 )

 


정리

 

그니깐 그냥 Pandas로 데이터 전체적으로 확인하고 삽입, 삭제, 질의 등을 통해 지울거 지워

그리고 나서 Numpy를 통해 수식 계산이나 연산을 통해 데이터를 통계내고 싶으면 pandas -> values 를 통해 numpy배열 생성해서 거기서 계산 후 다시 pandas로 저장하자!