deepseek开源代码
每经记者:宋欣悦 每经编辑:陈柯名 兰素英 杜恒峰 校对:金冥羽|每日经济新闻 nbdnews原创文章|未经许可禁止转载、摘编、复制及镜像等使用。
近日,DeepSeek在业界掀起了一股不小的波澜。就在2月26日,他们宣布开源了名为DeepGEMM的计算库,此库能够支持稠密和MoE模型的训练和推理。
DeepGEMM以其简洁高效的特点吸引了大家的注意,其仅有300行核心代码,但却展现出了卓越的性能。在一些特定场景下,它的表现甚至超越了那些经过专家精心调优的计算库,可以说是在极致榨干GPU的性能潜力。该计算库支持密集布局和两种MoE布局,使用了CUDA编写,无需编译即可轻松安装。它还具备完全即时编译的特点,即装即用。值得一提的是,DeepGEMM还针对NVIDIA Hopper张量核心进行了优化。针对CUDA核心中遇到的FP8张量核心累加不精确的问题,DeepGEMM也给出了解决方案。
自DeepSeek官宣启动“开源周”以来,英伟达的股价一直处于波动状态。美东时间周三(北京时间2月27日凌晨),英伟达将公布其重要财报。这份财报是英伟达在DeepSeek横空出世后的首份财报,引起了市场的广泛关注。在此背景下,人们不禁要问:黄仁勋能否交出令人满意的答卷?DeepSeek的崛起对英伟达又将产生怎样的影响?我们期待着DeepSeek对此的解读。而实际应用中对于这类科技产品的新解读也相当引人注目,“看来不论是一丝不苟的行业趋势分析还是富有创意的脑洞大开,DeepSeek都能轻松应对。”同时也有用户反映,“别再出现服务器繁忙的情况了。”好消息是最近一款App接入了DeepSeek后响应迅速、使用丝滑流畅。“不论是问公司、问投资、问还是自由对话都能轻松搞定。”该App的使用相当简单方便,每日经济新闻App用户可以直接在首页使用DeepSeek功能。此外每日经济新闻还推出了新功能“大模型解读投资热榜”,用户只需点击投资热榜中的新闻就能得到大模型的全面分析还能一键生成图片分享给朋友。告别服务器繁忙的困扰快来使用每日经济新闻App吧!免责声明:本文内容与数据仅供参考不构成投资建议使用前请核实据此操作风险自担。记者宋欣悦编辑陈柯名兰素英等也有贡献于本文的撰写和编辑。