본문 바로가기

부스트캠프 AI Tech

(53)
Bar plot Bar plot category에 따른 값을 비교하기에 적절 .bar , .barh(그래프를 옆으로 눕힘) Stacked Bar plot 각 그룹을 쌓아서 표현 모든 그룹의 순서는 일정해야 함 전체에서 비율을 나타내는 percentage stacked bar chart Overlapped Bar plot 각 그룹을 겹쳐서 표현 3개 이상에서는 어려움 - area plot 사용 투명도를 조절하는 alpha Grouped Bar plot 각 그룹을 이웃되게 표현 구현이 까다로움(set_xticks, set_xticklabels) 그룹이 많을 경우 예외 처리 Principle of Proportion ink 실제 값과 표현되는 잉크 양은 비례해야 함 x축의 시작은 zero Data sorting 시계열 - 시..
Matplotlib Matplotlib Figure(틀) - subplot(그래프) figsize - figure 크기 fig.get_facecolor() - 바깥 배경색 color, label, legend(범례) set_title - sub title, suptitle - super title ticks(범위), ticklabels(텍스트) annotate, text - 원하는 좌표에 텍스트 출력
Data visualization Data visualization Data - global data? local data? 정형 데이터(csv) : 통계적 특성, 데이터 간 비교 시계열 데이터 : 추세(trend), 계절성(seasonality), 주기성(cycle) 지리 데이터 : 거리, 경로, 분포 관계 데이터 : 객체 - 객체 관계, node - link, 휴리스틱한 노드 배치 계층적 데이터 : tree, treemap, sunburst 등 mark - basic praphical element in an image - 점, 선, 면으로 이루어진 데이터 시각화 channel - 각 마크를 변경할 수 있는 요소들 - 위치, 색, 모양 등 pre-attentive attribute - 주의를 주지 않아도 인지되는 요소 - 분리되어 있..
Trouble shooting Out Of Memory 정확한 에러 해결이 어려움 원초적인 방법 -> batch size down GPUtil GPU의 상태를 보여주는 모듈 iter마다 메모리가 늘어나는지 확인할 것 import GPUtil GPUtil.showUtilization torch.cuda.empty_cache() # 사용되지 않은 gpu cache 정리 # del과 구분해야 함 # reset대신 쓰기 좋음 1d tensor는 기본 객체로 변환하여 저장 필요 없는 변수는 del 삭제 OOM 발생 시 batch size 1로 해보기 with torch.no_grad(): # statement # backward가 일어나지 않음 colab에서 너무 큰 사이즈는 x CNN은 대부분 shape 문제 tensor의 float pre..
Hyperparameter Tuning 모델, 데이터, H/T 중요도는 데이터 > 모델 > H/T 순 Hyperparameter Tuning learning rate, 모델의 크기, optimizer 등 grid, random, bayesian 기법 등 가성비가 떨어지니 마지막에 할 것 Ray multi node, multi processing ML/DL의 병렬 처리 표준 hyperparameter search를 위한 모듈 config에 search space 지정 학습 scheduling 알고리즘 지정 출력 양식 지정 tune.run() -> 병렬 처리
Model Control Model.save architecture, parameter 저장 model.state_dict() # 모델의 parameter 출력 torch.save(model.state_dict(),PATH) # 같은 형태의 모델의 parameter 저장 torch.load_state_dict(PATH) # 같은 형태의 모델에서 parameter 로드 torch.save(model, PATH) # architecture와 parameter 모두 저장 torch.load(PATH) # architecture와 parameter 모두 로드​ Checkpoints 학습의 중간 결과 저장, early stopping epoch, loss, mertric 값을 지속적으로 저장 torch.save({ 'epoch': e '..
Pytorch - Project template
Pytorch - basic Pytorch Define by Run - runtime 중 graph 생성 GPU support, good API, easy debugging 기본적으로 numpy의 사용법과 매우 유사 view, reshape은 contiguity(연속적인 데이터의 저장) 보장의 차이