Machine Learning

K-Fold Cross Validation 이란? overfitting을 막기 위해서 데이터를 쪼갠 다름에 k개로 나누어 train데이터 안에서도 일부는 훈련, 일부는 테스트 데이터 셋으로 나뉜다. repeated k-fold는 이러한 과정을 N번 반복하며, 과정마다 각기 다른 데이터 셋이 훈련 및 테스트된다. macro average ROC curve란? 세 그룹 이상 범주형 데이터를 분류할때, ROC curve를 나타내는 방법을 말한다. 만약 A, B, C그룹이 있다면, A vs B + C로 분류의 정확도를 비교하여 평균 내는 방법이다. Multiclass Receiver Operating Characteristic (ROC) Multiclass Receiver Operating Characteris..
# 데이터 처리 X = x.value y feature_names = list(x.column) # 모델 model = xgb.XGBClassifier() model.fit(X, y) # 이름 붙이기 # https://stackoverflow.com/questions/46943314/xgboost-plot-importance-doesnt-show-feature-names model.get_booster().feature_names = feature_names xgb.plot_importance(model.get_booster()) # importance importance = model.feature_importances_ # 저장 importance_df = pd.DataFrame({'Feature':..
김해김씨99대손
'Machine Learning' 카테고리의 글 목록