최근 포스트

pandas

최대 1 분 소요

series는 벡터, Dataframe은 행렬과 대응 indexer( index는 행과 같음) ✓ loc 인덱서: 명시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함 행 조회: df.loc[‘index’] ...

p-value

최대 1 분 소요

𝜷에 대한 p-value가 낮으면 기울기가 0 이 아닌 것으로 판명 통상적으로 p-value가 0.05이하면 의미 있다고 판단 (𝜷의 기울기가 0일 확률이 0.05 이하라고 해석함) 즉, p-value가 0.05 이하면 𝑯𝟎 (귀무가설)은 기각 되며 𝑯𝟏이 채택 됨

oversampling

최대 1 분 소요

데이터내클래스비율이 Imbalance 할 경우, 타겟의 모수가 많은쪽을줄이는기법(Random, SMOTE 등) Random은 Undersampling과 반대로 비율이 낮은 데이터를 Random으로 복제하여 데이터의양을 늘림 SMOTE(Synthetic Minority ...

objective

3 분 소요

-1. Huber 손실 함수 (Huber): - Huber 손실 함수는 제곱 오차 손실과 절대 값 오차 손실의 조합입니다. - 오차가 작은 경우에는 제곱 오차를 사용해 민감하게 반응하고, 오차가 큰 경우에는 절대 값 오차를 사용해 이상치에 덜 민감하게 반응합니다. ...

numpy

2 분 소요

numpy.array([list],dtype=)구조 8bit=-128~127, 64bit=-2^63~2^63-1 numpy array [i,j]가능 random.rand(m,n): m행n열 짜리 0~1사이의 랜덤수 행렬