Hasil pencarian
Loncat ke navigasi
Loncat ke pencarian
- ...<code>DeepSeek-Math</code> yang dikhususkan untuk mengerjakan soal-soal [[matematika]]: <code>Base</code>, <code>Instruct</code>, <code>RL</code>. Pelatihannya ...'instruction-following model'' oleh SFT <code>Base</code> dengan 776K soal matematika dan solusi ''tool-use-integrated step-by-step''. Tahap ini menghasilkan mod ...54 KB (6.733 kata) - 7 Maret 2025 17.13