文章指出,假定GPU租赁成本为每小时2美元,每天的总成本为近8.71万美元,如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为约56.2万美元,成本利润率545%。

文章表示,DeepSeek-V3/R1推理系统的最佳化目标是更大的吞吐,更低的延迟;为实现这两个目标,其方案是使用大规模跨节点专家并行(EP),但方案亦增加系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时、以及进行负载平衡。

#DeepSeek #利润率 #推理 #优化