⚛️ 양자화란?양자화(Quantization)는 모델 크기를 줄이고 속도를 향상시키기 위해 가중치를 저정밀도로 변환하는 과정입니다. 이를 통해 메모리 사용량을 절감하고, 저사양 환경에서도 모델을 실행할 수 있도록 합니다. 다만, 정밀도가 낮아질수록 품질 손실이 발생할 수 있습니다. ✅ 양자화 모델 종류📌 구형 양자화 타입 (일부 기본 모델에서 필요)Q4_0: 매우 작음, 품질 손실 큼 → Q3_K_M 사용 권장Q4_1: 작음, 품질 손실 상당함 → Q3_K_L 사용 권장Q5_0: 중간 크기, 균형 잡힌 품질 → Q4_K_M 사용 권장Q5_1: 중간 크기, 품질 손실 적음 → Q5_K_M 사용 권장📌 신규 양자화 타입 (추천됨)Q2_K: 가장 작음, 품질 손실 극심 → 추천하지 않음Q3_K: Q3_K..