Zum Inhalt der Seite gehen

sorry heise, aber euer „destilliertes deepseek" ist kein deepseek. ihr nutzt ein fine-getuntes model auf basis von qwen, welches mit output daten von deepseek angereichert wurde.

Das entnehme ich jetzt rein des frei verfügbaren Textes und des Wissens dass es kein deepseek model gibt welches auf eine 5090 passt.

ich nehme an ihr lasst eines der folgendes models von ollama laufen
ollamas description of deepseek models it hosts. at the top is the original deepseek with 671b parameters while below are the qwen distills.