Hasil pencarian

Loncat ke navigasi Loncat ke pencarian
  • ...<code>DeepSeek-Math</code> yang dikhususkan untuk mengerjakan soal-soal [[matematika]]: <code>Base</code>, <code>Instruct</code>, <code>RL</code>. Pelatihannya ...'instruction-following model'' oleh SFT <code>Base</code> dengan 776K soal matematika dan solusi ''tool-use-integrated step-by-step''. Tahap ini menghasilkan mod ...
    54 KB (6.733 kata) - 7 Maret 2025 17.13