deepseekv3是近期震惊全球的知名AI大模型,这款全新的AI大模型拥有着和国外的chatgpt一样的性能,但是目前deepseekv3却是免费开放向大家使用的,不收取任何的费用,而chatgpt使用的费用却更加的高昂。
DeepSeek 官方推出的 AI 助手,免费体验与全球领先 AI 模型的互动交流。
使用一经开源即在海内外引起震动、总参数超过 600B 的 DeepSeek-V3 大模型,多项性能指标对齐海外顶尖模型,用更快的速度、更加全面强大的功能为你答疑解惑,助力高效美好的生活。
性能对齐海外领军闭源模型
DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。
论文链接:
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdfDeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
长文本:长文本测评方面,在DROP、FRAMES 和 LongBench v2 上,DeepSeek-V3 平均表现超越其他模型。
代码:DeepSeek-V3 在算法类代码场景(Codeforces),远远领先于市面上已有的全部非 o1 类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
数学:在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3 大幅超过了所有开源闭源模型。
中文能力:DeepSeek-V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近,但在事实知识 C-SimpleQA 上更为领先。
生成速度提升至 3 倍
通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。
API 服务价格调整
随着性能更强、速度更快的 DeepSeek-V3 更新上线,我们的模型 API 服务定价也将调整为每百万输入tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出tokens 8元,以期能够持续地为大家提供更好的模型服务。
与此同时,我们决定为全新模型设置长达45天的优惠价格体验期:即日起至2025年2月8日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入tokens 0.1元(缓存命中)/ 1元(缓存未命中),每百万输出tokens 2元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。
开源权重和本地部署
DeepSeek-V3 采用 FP8 训练,并开源了原生 FP8 权重。得益于开源社区的支持,SGLang和LMDeploy 第一时间支持了 V3 模型的原生 FP8 推理,同时TensorRT-LLM和MindIE则实现了 BF16 推理。此外,为方便社区适配和拓展应用场景,我们提供了从 FP8 到 BF16 的转换脚本。
“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展,也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。
这是一个全新的开始,未来我们会在 DeepSeek-V3 基座模型上继续打造深度思考、多模态等更加丰富的功能,并将持续与社区分享我们最新的探索成果。
先看一下使用效果:
使用效果如下:
下面给大家详细讲解一下我的搭建方法,下载书籍我使用的是zlibrary,https://zh.z-lib.gs/
构建知识库我使用的是https://cherry-ai.com/ 这个软件,他是一个集成了多个AI模型的客户端。
主要的功能有下面这些
知识库构建
下面我们就可以开始去构建我们自己的知识库了,首先第一步我们需要设置解析书籍的模型,将书籍向量化,也就是变成一个个单词方便模型进行读取。
进入地址 https://siliconflow.cn/zh-cn/ 注册一个账号
然后在模型里添加BAAI/bge-m3模型,这是一个免费的模型
看到最下面就添加成功了,然后我们填入api密钥
将密钥填写到对应的位置之后,就可以开始上传我们的书籍,点击左侧知识库
点击添加,名称自己可以进行设置,模型选择刚才设置的模型
点击添加文件,上传刚才下载的书籍,这里只支持几种格式要记得进行转换
deepseek模型配置
等待向量化完成就可以了,接下来需要配置deepseek模型,因为硅基流动里是没有V3模型供我们使用的,所以我们需要自己去注册Deepseek官方的api。
点击下面的按钮,先打开deepseek的使用
然后我们进deepseek的官方 https://platform.deepseek.com/去充值并获取api,目前deepseek价格非常便宜,充10块钱送10块钱就可以使用百万token,完全够我们使用了。
充值之后点击左侧API keys,创建一个API key然后填到上面要填api key的地方就可以开始使用了。
使用方法
进入默认的助手
点击知识库,选择导入的书籍
选择模型,这里的deepseek chat就是我们对应的模型,然后进行提问即可。
感谢大家的阅读,给大家准备了一个精心整理的黑科技工具箱。包含各类日常使用的工具以及好用的AI提效工具。
Spacedesk是一款功能强大的多屏协作工具软件,旨在全方位满足不同年龄、职业、使用场景的用户在拓展屏幕显示、提升工作效率、增强娱乐体验以及实现便捷的设备互联等多方面的需求。
Windfinder是一款功能强大的应用,提供实时的风速、风向信息,这对于帆船、冲浪、风筝冲浪等依赖风力活动的爱好者来说至关重要。包含海浪的高度、周期和形态,帮助冲浪者和海上运动者了解海况。详细的天气预报,包括温度、湿度、降水概率等,有助于用户规划日常活动。
Wunderground是一款值得推荐的天气预报应用程序。用户可以实时查看各种气象图,包括卫星云图、雷达图、温度图、湿度图等,这些图表为用户提供了直观的气象信息。实时更新功能确保用户获取到的数据是最新的,有助于用户及时做出决策或采取相应措施。
Avee Player是一款功能强大的音乐可视化软件,支持导入和编辑多种格式的音乐文件,包括但不限于MP3、WAV、FLAC等,让用户可以享受高质量的音乐播放。用户可以通过简单的操作,从设备存储中选择并导入包含音乐文件的文件夹,软件会自动扫描并添加曲目到其音乐库中。