3
1 2 3 4 5 6
Google 推出 Gemini 3 Flash 高速低延迟 AI 模型全球登场
文章索引: LLM
Google 今天进一步扩展 Gemini 3 模型系列,推出全新的 Gemini 3 Flash。此模型以速度为核心,兼具高效能与低成本,专为需要高频率工作流程的企业及开发者而设,能在近乎即时的环境下处理资讯、建立自动化工作流及开发具回应性的智能应用。

▪️企业:Gemini 3 Flash 针对追求速度的高频率工作流程作出完善,却无须牺牲品质。这让企业能够处理近乎即时的资讯,自动化複杂的工作流程,并构建反应迅速的代理程式(agentic applications)。

▪️开发者:Gemini 3 Flash 在逻辑推理、工具应用及多模态处理方面表现卓越。对于需要处理複杂任务如影片分析、数据撷取及视觉问答等的开发者而言,是个理想选择。这将助开发出更智能、且兼备「快速回应」与「深层推理」能力的应用程式,例如游戏内置助理或 A/B 测试实验。
商汤论大模型未来 多模态与具身智能成新蓝图
文章索引: LLM
近年AI发展呈阶段性跃升:由生成式 AI(GenAI)带动内容创作与知识普及,进一步演化为代理式 AI(Agentic AI),能在工作流中自我学习并协作完成複杂任务;同时亦走向具身智能(Embodied AI),让智能体透过「身体」与物理世界交互,推动在工业、服务及家庭等场景实施。此趋势显示 AI 正由虚拟走向现实,从工具转型为能持续进化的产业基础设施。

商汤科技董事长兼 CEO 徐立博士指出,过去 10 年是人工智能(AI)认知变化最快的时期,AI 正由感知走向生成,再迈向具身智能与世界模型,重塑各行各业的工作方式。

多模态大模型的突破
R2延迟推出 DeepSeek拟用华为晶片训练AI失败
文章索引: LLM
DeepSeek 原定于今年 5 月推出新一代 AI 模型 R2,惟因未能成功以华为 Ascend 晶片完成训练,导致项目延误,突显中国在高阶晶片领域仍倚赖美国技术。

据知情人士透露,DeepSeek 在今年初推出 R1 模型后,获官方鼓励改用华为晶片取代美国 Nvidia 系统。惟在 R2 模型训练过程中,Ascend 晶片出现稳定性问题及软件支援不足,最终公司改以 Nvidia 晶片进行训练,仅保留华为晶片作推理用途。

AI 模型训练需大量数据学习,而推理则是模型完成训练后,用于生成回应或预测的步骤。儘管华为曾派工程团队驻场支援,DeepSeek 仍未能成功完成训练。DeepSeek 的困境,反映中国晶片在处理关键任务方面仍落后美国,亦揭示北京推动科技自主的挑战。
AWS 全面支援 OpenAI 开放权重模型 推动 Agentic AI 企业应用迈向 3000 亿美元市场
文章索引: LLM
随着 Agentic AI(AI 代理)应用日益普及,AWS 预期企业对能执行複杂任务的 AI 模型需求将持续上升。据 Gartner 预测,到 2028 年,将有 33% 企业级应用程式整合 Agentic AI,潜在市场规模高达 3000 亿美元。

紧接着 OpenAI 推出新开放权重语言模型 gpt-oss-120b 及 gpt-oss-20b,AWS 亦马上宣佈支援两款新模型,并透过 Amazon Bedrock 及 Amazon SageMaker AI,让全球客户可快速部署生成式 AI 应用。

性价比、透明度与信任兼收并蓄
OpenAI 推新开源语言模型 效能媲美 GPT-4o
文章索引: LLM
OpenAI 于本月 5 日公开推出两款全新开源语言模型:gpt-oss-120b 及 gpt-oss-20b,并以 Apache 2.0 授权条款公开模型权重。两款新模型乃 OpenAI 自 GPT-2 以来,首次释出具代表性的开放权重语言模型,无论在推理能力、工具使用及部署效率方面皆表现卓越。

官方指出,gpt-oss-120b 在核心推理测试中,表现接近 o4-mini,并可于单一 80GB GPU 上高效运行;而 gpt-oss-20b 则仅需 16GB 记忆体,即可在边缘装置上运作,适合本地推论及快速迭代。两者在 TauBench、HealthBench 等评估中表现优异,甚至超越 GPT-4o 及 o1 等专有模型。

模型架构方面,gpt-oss 採用 Transformer 结构及 mixture-of-experts 技术,并支援最长 128k 上下文长度。模型训练以英文纯文字资料为主,涵盖 STEM、程式编写及一般知识,并使用升级版分词器 o200k_harmony。至于安全性方面,OpenAI 为 gpt-oss 模型进行全面安全训练与对抗性微调测试,并通过外部专家审核,确保模型符合高安全标准。OpenAI 亦举办红队挑战赛,鼓励全球研究人员协助发掘潜在风险。
3
1 2 3 4 5 6