分类: 人工智能

英特尔Gaudi 2D AI加速器针对DeepSeek Janus Pro模型进行优化

近日,DeepSeek发布JanusPro模型,其超强性能和高精度引起业界关注。英特尔Gaudi 2D AI加速器现已针对该模型进行优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化,有效满足行业应用对于推理算力的需求,为AI应用的落地和规模化发展提供强有力的支持。

OpenAI o3-mini正式发布!奥尔特曼罕见认错:DeepSeek是一个非常好的模型!

北京时间2月1日凌晨,为应对DeepSeek-R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优。

DeepSeek掀起AI算力革命:英伟达暴跌17%!台积电暴跌13%!

近日,中国人工智能(AI)大模型技术厂商DeepSeek(深度求索)发布的推理大模型DeepSeek-R1火爆网络,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20,API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。这不仅引发了外界对于OpenAI、Meta、谷歌等众多大模型厂商严重依赖于高成本的英伟达AI芯片持续堆算力的“大力出奇迹”模式的质疑,也导致了市场对于众多市值已大涨的AI芯片股的价值需要重估的担忧。

科大讯飞携手华为发布首个基于全国产算力的深度推理大模型X1!

1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,作为国内智能翻译领域的佼佼者,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。

性能比肩GPT-4o!国产AI大模型DeepSeek-V3发布:成本仅为GPT-4o二十分之一

12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。国外独立评测机构Artificial Analysis测试了DeepSeek-V3后表示,“DeepSeek-V3超越了迄今为止所有开源模型。”更为关键的是,该模型使用英伟达H800 GPU在短短两个月内就训练完成,并且仅花费了约558万美元。