根据DeepSeek的微信公告,更新后的R1版本采用宽松的MIT许可证,这意味着它可以用于商业用途,这是一个“小”升级。
HuggingFace代码库不包含该模型的描述,只有配置文件和权重,即指导模型行为的内部组件。
升级版R1的参数量高达6850亿,规模相当庞大,如果不进行修改,该模型很可能无法在消费级硬件上运行。
今年早些时候,DeepSeek发布R1模型后声名鹊起,其模型与OpenAI的模型形成了鲜明对比。但这家初创公司也引发了美国一些监管机构的关注,他们认为DeepSeek的技术构成了国家安全风险。
相关文章:
DeepSeekR1模型已完成小版本试升级

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】