商汤科技推出日日新 SenseNova 6.7 Flash-Lite，多模态能力实现质的飞跃

1,878 0

近日，商汤科技正式发布其日日新大模型系列的最新成员——SenseNova 6.7 Flash-Lite。该模型在保持轻量化架构优势的同时，于多模态理解与生成能力上实现了显著突破，标志着商汤在端侧与边缘计算场景的AI部署能力迈入新阶段。

技术架构与核心突破

SenseNova 6.7 Flash-Lite采用了商汤自研的跨模态对齐与融合技术，在参数规模缩减至6.7B量级的前提下，通过创新的注意力机制优化与视觉-语言联合预训练策略，大幅提升了图文、视频等多模态信息的协同处理效率。其核心突破在于实现了**语义级的多模态特征统一表达**，使得模型在图像描述、视觉问答、文档分析等任务中，不仅能够准确识别视觉元素，更能理解隐含的语义关系与上下文逻辑，误识别率较前代产品降低约40%。

性能与效率的平衡

作为“Lite”版本，该模型在推理速度与资源占用方面表现出色。通过量化压缩与算子融合技术，SenseNova 6.7 Flash-Lite可在消费级GPU甚至部分移动端芯片上实现实时推理，推理延迟较同级别开源模型缩短30%以上。这一特性使其特别适用于智能终端、物联网设备、实时交互系统等对功耗和响应速度要求严苛的场景，为多模态AI的规模化落地扫清了算力瓶颈。

行业影响与应用前景

此次发布不仅是商汤在模型轻量化技术上的重要里程碑，更折射出行业从“大而全”向“精而快”的转型趋势。多模态能力的“质变”意味着模型不再局限于简单的物体识别或文本匹配，而是能够进行跨模态推理与创造性生成——例如，根据用户拍摄的食材照片自动生成菜谱，或基于会议录像实时提取关键决策点。可以预见，SenseNova 6.7 Flash-Lite将在智能教育、智慧零售、工业质检、辅助创作等领域催生一批高价值应用，推动AI从“能看会听”向“能懂会做”迈进。商汤科技此举也进一步巩固了其在多模态AI赛道的技术壁垒，为国产大模型的差异化竞争提供了新的范本。