언어공부/python
[Python] Numpy와 Pandas 왜 둘 다 배워..?
기싼
2022. 10. 5. 22:05
솔직히 csv읽어오고 데이터 전처리시 data frame만 사용하는거 같은데 왜 둘다 배움..?
.
.
pandas로 불러온 data frame에서 values로 계산 작업할때 결과물이 모두 numpy라서 numpy도 필요해
NumPy
특징
- N-demension의 Matrix에 대해 연산이 가능해!!
- Matrix내의 모든 원소는 같은 데이터 타입이어야만 해!!
- 난수 생성이 가능해
- 선형대수학에서 배운 내용들을 적용하기가 쉽다!
Pandas
특징
- csv와 같은 데이터 파일을 불러올때 종종 쓰여!
- SQL처럼 데이터에 대해 질의를 할수 있어
- col 별로 데이터 타입이 달라도 괜찮아!!
- 2차원 데이터만 사용이 가능해! ( n차원 이상에서는 사용이 불가능해.. excel이 3차원으로 나오진 않잖아 )
정리
그니깐 그냥 Pandas로 데이터 전체적으로 확인하고 삽입, 삭제, 질의 등을 통해 지울거 지워
그리고 나서 Numpy를 통해 수식 계산이나 연산을 통해 데이터를 통계내고 싶으면 pandas -> values 를 통해 numpy배열 생성해서 거기서 계산 후 다시 pandas로 저장하자!