谷歌Gemma4推理速度飙升3倍,离线大模型时代正式来临 # 谷歌Gemma4推理速度飙升3倍,离线大模型时代正式来临 近日,谷歌正式发布新一代轻量级大语言模型Gemma4,其推理速度相比前代提升高达3倍,同时模型体积进一步压缩,可在智能手机、PC等终端设备... AI资讯 1,583
千问PC端新增AI语音输入,各类应用内可直接语音调用千问 千问PC端新增AI语音输入:跨应用语音调用开启效率新范式 近日,阿里旗下大模型产品“千问”在PC端迎来重要功能升级——新增AI语音输入能力,并支持在各类应用内直接通过语音调用千问。这一更新标志着AI助... AI资讯 2,396
OpenAI携手英伟达等巨头推出MRC协议,重构大规模AI训练网络架构 # 背景:AI训练的网络瓶颈亟待突破 随着大模型参数规模突破万亿级别,传统分布式训练中的网络通信已成为性能提升的关键瓶颈。在千卡乃至万卡集群中,梯度同步、模型并行等操作产生的数据交换量呈指数级增长,而... AI资讯 2,153
Anthropic携手SpaceX巨量算力,Claude付费用户步入“无限速”新纪元 Anthropic携手SpaceX巨量算力,Claude付费用户步入“无限速”新纪元 合作背景:算力瓶颈的破局之选 在大模型应用加速普及的当下,API调用速率限制(Rate Limit)始终是阻碍用户... AI资讯 2,388
腾讯推出OpenSearch-VL:开源多模态深度搜索Agent的“一站式”方案 腾讯推出OpenSearch-VL:开源多模态深度搜索Agent的“一站式”方案 近日,腾讯正式发布了**OpenSearch-VL**——一款面向多模态深度搜索场景的开源Agent方案。该工具旨在为... AI资讯 2,363
OpenAI 豪掷 500 亿美元布局 AI 算力,引爆行业军备竞赛 OpenAI 豪掷 500 亿美元布局 AI 算力,引爆行业军备竞赛 事件概述 近日,OpenAI 宣布了一项规模空前的算力基础设施投资计划:未来数年内投入高达 500 亿美元,用于建设超大规模数据中... AI资讯 1,952
Arm 预计明年 AI 芯片销售额将达 20 亿美元 # Arm 预计明年 AI 芯片销售额将达 20 亿美元:架构优势与生态扩张的双重驱动 近日,Arm 在财报电话会议上透露,预计其 2025 财年(截至 2025 年 3 月)来自 AI 芯片的销售额... AI资讯 1,799
Snap 与 Perplexity 价值 4 亿美元的合作关系友好终止 # Snap 与 Perplexity 价值 4 亿美元的合作关系友好终止:背后逻辑与行业启示 据多方消息确认,Snap(Snapchat 母公司)与 AI 搜索初创公司 Perplexity 此前达... AI资讯 2,171
无问芯穹获超7亿元融资,加速“电能”向“Token”效率跃迁 # 无问芯穹获超7亿元融资,加速“电能”向“Token”效率跃迁 近日,AI基础设施企业无问芯穹(Infinigen AI)宣布完成超7亿元人民币的新一轮融资。本轮融资由多家头部机构联合领投,资金将主... AI资讯 2,393
xAI 推出 Grok Imagine 质量模式 API:视觉生成步入写实新阶段 xAI 推出 Grok Imagine 质量模式 API:视觉生成步入写实新阶段 近日,xAI 正式发布 Grok Imagine 质量模式 API,标志着其视觉生成能力从“可用”迈向“可信”的关键跨... AI资讯 2,243