파이썬 axis는 다른 언어에는 없는 기능으로, 대부분 행렬계산이 많이 일어나기 때문에 이를 지원합니다. 괜시리 있을 필요없어 보일때가 많지만, numpy행렬계산때는 유용하게 작동합니다.
아주 빠르게 axis 이해하기¶
axis는 python을 처음 시작할때, 조금 헷갈리는 부분이기도 하다. 아무 생각없이 axis = 1등의 옵션을 달아주면서 쓰는 모습을 발견하기 마련이다. 이제 확실히 이해해 보자.
2차원의 행렬이 있다고 해본다.
In [7]:
import numpy as np
array = np.random.randint(10, size=(5,3))
array
Out[7]:
여기서 axis = 0은 무엇일까? 5,3 행렬에서 처음 5라고 생각하면되고, 다섯개의 원소를 죄다 더한다고 보면 된다.
In [8]:
np.sum(array, axis = 0)
Out[8]:
더했기 때문에, 다섯개는 모두 더해지고 세개만 남는다.
만약 axis = 1로 놓는다면, 이제는 (5,3) 중 3이 합쳐지고 다섯개의 원소가 남는다.
In [11]:
np.sum(array, axis = 1)
Out[11]:
이차원의 데이터는 이해하기 쉬운데, 삼차원의 데이터는 어떨까?
In [13]:
array3 = np.random.randint(10, size=(5,3,2))
array3
Out[13]:
이제, 세가지의 데이터 방향이 있다. np.sum에서 axis = 0,1,2는 차례대로 5,3,2 데이터를 하나로 합쳐준다. 합계를 구하는 간단한 np.sum은 0은 5를 없애고 3,2를 남기고, 1은 3을, 2는 2를 없애고 나머지 차원을 살린다.
In [23]:
print(np.sum(array3, axis = 0))
print("")
print(np.sum(array3, axis = 0).shape)
In [24]:
print(np.sum(array3, axis = 1))
print("")
print(np.sum(array3, axis = 1).shape)
In [25]:
print(np.sum(array3, axis = 2))
print("")
print(np.sum(array3, axis = 2).shape)