腾讯混元等联合推出首个古文字OCR评测基准Chronicles-OCR

1,829 0

近日，腾讯混元等机构联合发布了 **Chronicles-OCR**，这是业界首个专门针对古文字的光学字符识别（OCR）评测基准。该基准的推出填补了传统OCR在古文字领域缺少标准化评价体系的空白，为人工智能技术在文化遗产数字化方向的应用提供了重要支撑。

# 古文字识别的技术瓶颈

古文字（如甲骨文、金文、简帛文字等）因载体多样、字形变异大、刻蚀磨损严重，使得通用OCR模型难以直接迁移。现有评测基准多聚焦于现代印刷体或手写体，缺乏对古文字复杂场景（如拓片纹理、模糊笔划、异体字）的覆盖。Chronicles-OCR 从实际问题出发，构建了包含多个时段、多种材质（甲骨、青铜、竹简）的古文字图像数据集，并设计了针对古文字特点的评估指标（如笔画级准确率、形近字区分度）。

# 基准的核心构成与创新点

据公开信息，Chronicles-OCR 不仅涵盖了 **甲骨文、金文、战国文字** 等主要古文字类别，还引入了 **字体风格多样性** 和 **噪声模拟** 机制，使评测结果更能反映模型在真实考古场景中的泛化能力。此外，该基准首次将 **大语言模型与视觉模型协同** 的评测逻辑纳入其中——即不仅仅判断字符识别是否正确，还要求模型具备对上下文语义（如卜辞断句、铭文通读）的辅助理解能力。这一设计显著提升了评测的学术深度。

# 对AI与文化遗产领域的影响

对于学术研究而言，Chronicles-OCR 提供了一个公平、可复现的“擂台”，帮助算法研究者量化其模型在古文字识别上的短板，尤其推动了小样本学习、域自适应等技术在罕见字形上的突破。对文博行业来说，该基准有望加速古籍数字化、甲骨缀合、青铜器铭文自动释读等工程落地，降低人工标注成本。

腾讯混元此次联合高校与考古机构推出该基准，也凸显了 **“大模型+专有领域”** 的技术路线：利用混元的多模态能力适配古文字任务，同时以权威评测反哺模型迭代。未来，Chronicles-OCR 或将成为古文字AI研究的标配工具，催生更多跨学科的智能释读方案。