Run Length Encoding

AAAABBCC와 같이 중복되는 코딩에서는 A4B2C2와같이 압축하는 기법을 뜻한다.

Sample DICOM 로딩 샘플 코드

sample image show Sample DICOM 이미지 로드 및 미리보기¶ DICOM이미지는 의학용 이미지를 다룰때 쓰임 In [1]: import…

주성분분석(PCA) 이해용 파이썬 코드

pca 주성분분석(PCA) 이해용 파이썬 코드¶ 주성분분석은 고차원 데이터를 저차원으로 투영하되, 최대한 정보를 가지고 있게끔 하는 방법입니다.…

마할라노비스 거리를 이용한 Elliptic Envelope 아웃라이어 디텍션

작성중 outlier 제거 후 방 In [1]: from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis import matplotlib.pyplot as plt In [2]: from…

데이터 분석 대회를 위한 모의 분류 데이터 만들기

이번에는 모의 데이터를 만들어서 데이터 분석대회를 모의로 개최하는 코드를 만들어 보겠습니다. i-hate-flip-y 가짜데이터를 통한 분류 문제…

LDA를 이용해 차원축소 후 Logistic Regression

LDA를 이용해 차원축소 후 Logistic Regression LDA(Linear Discriminant Analysis)을 이용한 이진분류 예제¶ 거의 모든 X변수는 정규분포를…

Logistic Regression을 이용한 이진분류 파이썬 코드

거의 모든 X변수는 정규분포를 띄고 있음Kaggle에서 Instant Gratification이라는 이름의 대회 데이터셋으로 Logistic Regression을 시도 glm_train_test Logistic…

결정계수(R2)와 설명분산점수 (Explained Variance Score)

sklearn.metrics 라이브러리를 까보면, 흔히쓰는 R스퀘어 (결정계수)말고도 비슷한 개념의 metrics가 한개가 더있다. 바로 설명분산점수(Explained Variance Score)인데 사실…

ResNet을 이용하여 바로 물체 예측 파이썬 치트코드

Resnet을 Tensorflow Hub를 통해 다운로드 받아 바로 예측할수 있습니다. 복잡한 훈련과정을 거치지 않더라도 바로 예측으로 사용할수…

LSTM+BERT 파이썬 치트코드

해당하는 코드는, BERT와 LSTM의 블렌딩 모델로써, Toxic 대회에서 상위 20%정도를 유지하는 코드입니다 BERT + LSTM (rank…