文章指出,假定GPU租赁成本为每小时2美元,每天的总成本为近8.71万美元,如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为约56.2万美元,成本利润率545%。
文章表示,DeepSeek-V3/R1推理系统的最佳化目标是更大的吞吐,更低的延迟;为实现这两个目标,其方案是使用大规模跨节点专家并行(EP),但方案亦增加系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时、以及进行负载平衡。
DeepSeek于知乎开设官方帐号,发布「DeepSeek-V3/R1推理系统概览」技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键讯息。
文章指出,假定GPU租赁成本为每小时2美元,每天的总成本为近8.71万美元,如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为约56.2万美元,成本利润率545%。
文章表示,DeepSeek-V3/R1推理系统的最佳化目标是更大的吞吐,更低的延迟;为实现这两个目标,其方案是使用大规模跨节点专家并行(EP),但方案亦增加系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时、以及进行负载平衡。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。