**gpt-oss-20b-eddy** 
실사용자 중심 Instruction 튜닝 모델


**gpt-oss-20b-eddy**는 [OpenAI의 `gpt-oss-20b`](https://huggingface.co/openai/gpt-oss-20b) 모델을 기반으로, 실제 사용자의 복잡하고 다양한 Instruction를 높은 정확도와 실용성으로 수행하도록 특수 파인튜닝된 모델입니다.

학술적인 벤치마크 성능을 넘어, 현실 세계의 사용자 요청에 유연하고 적절하게 반응하는 것을 최우선 목표로 개발되었습니다.

## 🎯 모델의 핵심 목표

본 모델의 튜닝은 다음과 같은 명확한 목표를 가지고 진행되었습니다.

1.  **향상된 Instruction Following**: 단순한 질의응답을 넘어, 여러 단계로 구성된 복잡한 명령이나 미묘한 뉘앙스가 포함된 사용자 지시를 정확하게 이해하고 수행합니다.
2.  **실사용 환경 적합성**: 벤치마크 데이터셋에 과적합(overfitting)되는 것을 지양하고, 실제 사용자들이 생성할 법한 비정형적이고 다양한 프롬프트에 대해 안정적이고 유용한 응답을 생성하도록 튜닝되었습니다.

-----

## 📈 성능 평가 (Evaluation)

베이스라인인 `oss-20b` 모델과 비교하여 주요 벤치마크에서 다음과 같은 성능을 보입니다.

| 벤치마크 (Benchmark) | `oss-20b` (Base) | `gpt-oss-20b-eddy ` (Ours) | Improvement |
| :--- | :---: | :---: | :---: |
| **aime25** | 63.33% | **73.33%** | **+10.00%** |
| drop | 76.04% | 76.48% | +0.44% |
| ARC | 93.86% | 93.88% | +0.02% |
| KMMLU-PRO Overall | 36.40% | 36.76% | +0.36% |

-----