点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
光明网讯(记者 雷渺鑫)9月16日, 世界互联网大会文化遗产数字化工作组专题会议在陕西西安举办。浙江大学文化遗产研究院副院长、浙江大学艺术与考古图像数据实验室副主任刁常宇在会上表示,当前,随着大模型的不断迭代升级,AI推理能力跃升、多模态认知与生成能力革新,已经融入了多数人的网络使用习惯,并开始在医疗、金融等领域发挥了巨大作用。但在文物领域,大模型的表现仍未能企及常规应用的门槛,更难以有效支撑专业人员的工作,其原因具有相当的复杂性和必然性。
浙江大学文化遗产研究院副院长、浙江大学艺术与考古图像数据实验室副主任刁常宇。光明网记者 赵金悦、潘迪/摄
刁常宇介绍说,大模型在文物领域应用欠佳的表现主要可概括为文物描述与识别错误、年代与真伪判断的臆测、材质与工艺的混淆、文化符号与纹饰的误读、历史背景与功能的虚构、修复与保护建议的误导等六方面。
“参考大模型表现优异的领域,如在许多基准测试和竞技编程任务中展现出卓越的功能正确性,有时甚至超越普通人类程序员的水平,但其在文物领域的表现颇有些捉襟见肘。我们有理由相信能力缺陷的主要原因缘自训练数据质量欠佳。”刁常宇认为,文物大模型数据集质量欠佳的原因包括数据保护门槛低、研究分歧和不完备、多模态数据语义对齐复杂、样本分布极度不均衡、容错率低等。
对此,他表示要探索正规授权、有序共享的数据集构建路径,方能具备构建文物大模型数据集构建的可能性。这既依赖于人工智能研究机构和头部企业在技术领域的不断创新,更依赖于文物管理部门和文物单位的远见卓识和开放共享。“中国已经在文物数字化保护领域走在了世界前列,希望未来在AI时代能够谱写新的壮丽篇章。”刁常宇说。