DeepSeek-V2发布:GPT-4性能白菜的价格

移动终端 2024-05-07 15:27 阅读:7

DeepSeek最新发布了第二代MoE模型DeepSeek-V2,在各项性能评测中展现出色的表现,与闭源模型GPT-4等竞争。该模型在中文综合能力和英文综合能力上表现卓越,在知识、数学、推理、编程等专业榜单上也取得领先位置。

DeepSeek-V2采用了创新的MLA架构,结合自研的Sparse结构DeepSeekMoE,在减少计算量和推理显存方面具有显著优势。这使得模型在保持性能的同时,将计算量降至最低,实现了高性能的同时降低了每token的成本。

实际部署在8卡H800机器上,DeepSeek-V2的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。而API的定价也十分具有竞争力,每百万tokens输入1元,输出2元。

DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台也提供注册即赠送大量tokens的优惠,以支持优质项目的发展。