풀타임 석사 미국에서 실제로 공부하는 방법으로, 비싼학비와 기회비용을 동시에 소모해가면서 해야하는 과정이다. 유지비까지 연간 약 1억은…
[글쓴이:] 운영자
카이스퀘어(Chi-square) 검정
범주형 변수가 그룹마다 빈도가 다른지 확인하는 방법 남자중 게이 비율 <-> 여자중 레즈비언의 빈도 차이가 있는지…
T-test와 ANOVA 차이
T-test는 2집단 까지 차이 비교가 가능 남/여 식욕차이 Anova는 3집단 이상 차이 비교 가능 남/여/트랜스젠더 식욕차이…
간단한 LSTM + embedding과 샘플가중치 및 여러개의 결과를 출력하는 모델
simple_LSTM Simple LSTM과 Embedding¶ 이번에는 결과를 두개 동시에 예측하는 방법입니다. In [0]: import numpy as np import…
LSTM (Long Short Term Memory)
입력게이트, 출력게이트, 망각게이트등을 이용해 그라디언트 소실 문제를 극복하고 맥락을 잘 보존하게끔 하는 신경망 방법론 텍스트분석처럼 앞뒤의…
그라디언트 소실 (Vanishing Gradient)
신경망을 훈련할때, 최종 출력에서 멀어질수록 값에 영향을 미치는값을 역산하여야 하는데, 거슬러올라가다보면 영향을 미치는 정도가 굉장히 작은…
피드백 구조 (Feedback Loops)
과거의 출력이 다시 입력이 되는 구조 순환신경망 (Recurrent Neural Network)에서 쓰이며, 기억저장소 같은 역할을 함 연속성이…
완전연결 레이어 (Fully Connected Layer)
앞단의 Convolution 레이어는 필요에 의해 일부만 연결되어있다고 할 수 있다. (이미지 픽셀 하나하나마다 연결되어있으면 쓸데없는 정보가…
배치 크기 (Batch Size)
Gradient Descent를 실행하고 모델의 가중치를 갱신할때 고려할 데이터의 갯수다. 배치 크기가 1이라면 Stochastic Gradient Descent가 된다.…
Embedding을 이용한 LSTM 파이썬 치트코드
해당하는 코드는 Kaggle의 Jigsaw Toxic Competition 커널중 보기쉽고 투표를 많이받은 대표적인 베이스라인 코드입니다. LSTM 기본 LSTM을…