谷歌I/O大会发布Gemini与沃尔沃新车EX60摄像头集成，实现多模态视觉感知

1,874 0

谷歌I/O大会发布Gemini与沃尔沃EX60摄像头集成，实现多模态视觉感知

在今年的谷歌I/O大会上，一项备受瞩目的合作成果正式亮相：谷歌将其最新多模态大模型Gemini深度集成至沃尔沃新一代纯电SUV EX60的车载摄像头系统中，实现车辆对周围环境的“多模态视觉感知”。这一突破标志着大模型技术从云端走向车端，为智能驾驶与人车交互开辟了全新路径。

技术原理：从“看见”到“理解”

传统车载摄像头系统主要依赖预训练的视觉模型进行目标检测（如行人、车辆、交通标志），但其能力局限于有限类别和固定场景。而Gemini的多模态视觉感知能力，能够将摄像头捕捉到的实时画面与自然语言理解、知识推理相融合。例如，当EX60的前视摄像头识别到路面上一块不规则的黑色物体时，系统不再仅仅判定为“障碍物”，而是通过Gemini的上下文推理，结合天气、时间、周边环境等数据，判断其可能是被风吹落的树枝或是施工遗留的沙袋，并给出更合适的避让策略。

场景落地：从行车安全到交互体验

在沃尔沃EX60上，这一集成主要应用于三个核心场景：首先是**增强型自动驾驶辅助**，Gemini能够理解复杂路况中的隐性风险，如识别出前方拥堵路段中突然跑出的儿童，或通过分析对向车辆驾驶员的姿态预判其变道意图。其次是**智能座舱人机交互**，驾驶员或乘客只需用自然语言描述周围的建筑、店铺或风景，Gemini即可利用摄像头画面与地图数据实时回答，例如“那栋红色大楼是什么公司？”或“左侧餐厅的评分如何？”。最后是**事后事故分析**，系统可基于多模态记录自动生成事故前数秒的语义化摘要，帮助车主和保险公司快速还原现场。

行业意义：车端大模型的关键一步

此次合作的价值不仅在于功能提升，更在于证明了大模型在车载端的高效部署可行性。沃尔沃EX60采用的边缘计算芯片经专门优化，可在毫秒级延迟内运行Gemini的轻量化版本，既保护用户隐私（数据本地处理），又减少云依赖。业内人士分析，这将推动传统Tier1供应商和主机厂重新思考电子电气架构，未来“端侧多模态大模型”有望成为智能汽车的标配。可以预见，随着Gemini与更多车企的深度集成，汽车将不再只是运输工具，而成为具备环境理解、主动推理能力的移动智能体。

AI资讯

谷歌与黑石联手组建新云公司，50亿美元投入TPU集群，未来训练大模型或能更快更便宜

谷歌I/O大会发布Gemini与沃尔沃新车EX60摄像头集成，实现多模态视觉感知

OpenAI 发布“容量保障”服务：算力访问再提升

Google 推出首款 AI 智能眼镜支持 iPhone 和 Android 手机

相关文章

谷歌与黑石联手组建新云公司，50亿美元投入TPU集群，未来训练大模型或能更快更便宜

传华为AI眼镜计划上半年上市:采用轻量三电池方案

搜索迈入智能体时代：谷歌Chrome浏览器全面融合Gemini，化身全能AI助手

腾讯WorkBuddy升级：新增微信直连与自动化任务执行功能

最新资讯

谷歌I/O大会发布Gemini与沃尔沃新车EX60摄像头集成，实现多模态视觉感知

OpenAI 发布“容量保障”服务：算力访问再提升

Google 推出首款 AI 智能眼镜 支持 iPhone 和 Android 手机

相关文章

谷歌与黑石联手组建新云公司，50亿美元投入TPU集群，未来训练大模型或能更快更便宜

传华为AI眼镜计划上半年上市:采用轻量三电池方案

搜索迈入智能体时代：谷歌Chrome浏览器全面融合Gemini，化身全能AI助手

腾讯WorkBuddy升级：新增微信直连与自动化任务执行功能

最新资讯

Google 推出首款 AI 智能眼镜支持 iPhone 和 Android 手机