站长之家(ChinaZ.com) 11月30日 消息:深度求索发布了一个67B 的大模型,名为 DeepSeek LLM67B。这个模型完全开源,可以通过访问 chat.deepseek.com 来使用。
DeepSeek LLM67B 在公开评测榜单上表现良好,特别是在推理、数学和编程能力方面。DeepSeek 还开源了7B 和67B 的两种规模的模型,并提供了9个训练中途的模型 checkpoints 的下载。
DeepSeek LLM67B 在数学和指令跟随的测试中表现出色,并在 LeetCode 周赛中遥遥领先。最后,在开放域推理的测试中,DeepSeek LLM67B 展现出了较好的表现。
Hugging Face 首页:https://huggingface.co/deepseek-ai
GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-LLM
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】