Die Monetary Occasions berichtete, dass Deepseek aufgrund von Leistungsproblemen mit Huawei Ascend -Prozessoren die Veröffentlichung seines neuen R2 -Großsprachenmodells verzögerte und die Grenzen von Pekings Push, die US -Technologie ersetzt, nach Angaben der FT hervorheben.
Die Veröffentlichung zitierte drei Quellen, die sagten, dass chinesische Regierungsbeamte Deepseek ermutigten, nach der Veröffentlichung Anfang dieses Jahres von Deepseeks R1 -Modell, das die KI -Welt erschütterte, nach der Veröffentlichung von Deepseeks R1 -Modell zu verwenden.
„Aber das chinesische Begin-up stieß bei seinem R2-Trainingsprozess mithilfe von Ascend-Chips anhaltende technische Probleme.“ Die FT berichtete„Aufforderung, Nvidia -Chips für Coaching und Huawei für Inferenz zu verwenden, sagte die (Quellen).“
Die Nachricht erfolgt inmitten anderer Berichte, dass Nvidia und AMD GPUs – die NVIDIA H20 und AMD MI308 – derzeit nach einer Änderung der US -Exportregel den Export nach China zugelassen haben wie Chinas einheimische GPUs. Es gibt auch Berichte, dass die chinesischen Behörden Unternehmen bitten, die Verwendung von amerikanischen GPUs zu rechtfertigen.
In dem FT-Artikel wurden Quellen zitiert, in denen die Huawei-Prozessoren Stabilitätsprobleme haben: „langsamere Konnektivität zwischen Chip und minderwertige Software program im Vergleich zu NVIDIA-Produkten“.
In dem Versuch, die Probleme zu lösen, arbeitete ein Group von Huawei -Technikern vor Ort mit Deepseek zusammen, aber ein erfolgreicher Trainingslauf konnte bei den Ascend -Prozessoren nicht erreicht werden, heißt es in Quellen.
Die FT sagte, Deepseeks R2 -Modell könnte „in den kommenden Wochen“ veröffentlicht werden.
