1
1
DeepSeek 突发史上最长当机 服务瘫痪逾 7 小时 新一代模型蓄势待发?
文章索引: DeepSeek
官方状态页面确认,是次「重大事故」持续超过 7 小时,导致网页版及 API 服务全面停摆。虽然目前已恢复运作,但官方对起因保持缄默,引发业界猜测这是否为下一代旗舰模型上线前的预兆。

故障时长破纪录

自 DeepSeek R1 及 V3 模型于 2025 年初问世后,运作纪录一直维持在 99% 以上。惟周一凌晨起,服务出现长达 7 小时 13 分钟的中断,直至当地时间上午 10 时 33 分才宣告修复,规模远超以往 2 小时内的零星当机。
R2延迟推出 DeepSeek拟用华为晶片训练AI失败
文章索引: DeepSeek
DeepSeek 原定于今年 5 月推出新一代 AI 模型 R2,惟因未能成功以华为 Ascend 晶片完成训练,导致项目延误,突显中国在高阶晶片领域仍倚赖美国技术。

据知情人士透露,DeepSeek 在今年初推出 R1 模型后,获官方鼓励改用华为晶片取代美国 Nvidia 系统。惟在 R2 模型训练过程中,Ascend 晶片出现稳定性问题及软件支援不足,最终公司改以 Nvidia 晶片进行训练,仅保留华为晶片作推理用途。

AI 模型训练需大量数据学习,而推理则是模型完成训练后,用于生成回应或预测的步骤。儘管华为曾派工程团队驻场支援,DeepSeek 仍未能成功完成训练。DeepSeek 的困境,反映中国晶片在处理关键任务方面仍落后美国,亦揭示北京推动科技自主的挑战。
1
1