腾讯混元等联合推出首个古文字OCR评测基准Chronicles-OCR

腾讯混元等联合推出首个古文字OCR评测基准Chronicles-OCR

近日,腾讯混元等机构联合发布了 **Chronicles-OCR**,这是业界首个专门针对古文字的光学字符识别(OCR)评测基准。该基准的推出填补了传统OCR在古文字领域缺少标准化评价体系的空白,为人工智能技术在文化遗产数字化方向的应用提供了重要支撑。

# 古文字识别的技术瓶颈

古文字(如甲骨文、金文、简帛文字等)因载体多样、字形变异大、刻蚀磨损严重,使得通用OCR模型难以直接迁移。现有评测基准多聚焦于现代印刷体或手写体,缺乏对古文字复杂场景(如拓片纹理、模糊笔划、异体字)的覆盖。Chronicles-OCR 从实际问题出发,构建了包含多个时段、多种材质(甲骨、青铜、竹简)的古文字图像数据集,并设计了针对古文字特点的评估指标(如笔画级准确率、形近字区分度)。

# 基准的核心构成与创新点

据公开信息,Chronicles-OCR 不仅涵盖了 **甲骨文、金文、战国文字** 等主要古文字类别,还引入了 **字体风格多样性** 和 **噪声模拟** 机制,使评测结果更能反映模型在真实考古场景中的泛化能力。此外,该基准首次将 **大语言模型与视觉模型协同** 的评测逻辑纳入其中——即不仅仅判断字符识别是否正确,还要求模型具备对上下文语义(如卜辞断句、铭文通读)的辅助理解能力。这一设计显著提升了评测的学术深度。

# 对AI与文化遗产领域的影响

对于学术研究而言,Chronicles-OCR 提供了一个公平、可复现的“擂台”,帮助算法研究者量化其模型在古文字识别上的短板,尤其推动了小样本学习、域自适应等技术在罕见字形上的突破。对文博行业来说,该基准有望加速古籍数字化、甲骨缀合、青铜器铭文自动释读等工程落地,降低人工标注成本。

腾讯混元此次联合高校与考古机构推出该基准,也凸显了 **“大模型+专有领域”** 的技术路线:利用混元的多模态能力适配古文字任务,同时以权威评测反哺模型迭代。未来,Chronicles-OCR 或将成为古文字AI研究的标配工具,催生更多跨学科的智能释读方案。

相关文章