您的位置: 首页 > 实时讯息 >

西北师大发布DeepJiandu数据集:AI解密简牍 全球与众共享

0次浏览     发布时间:2025-03-28 00:35:00    

来源:中国新闻网

中新网兰州3月28日电 (丁思 刘玉桃)为破解智能化简牍文字识别与内容理解这一重大难题,近日,西北师范大学联合甘肃简牍博物馆推出了DeepJiandu数据集,全球与众共享。

DeepJiandu数据集,是在该校简牍学术资源数据共享平台的基础之上,研究发布的全球首个专门用于复杂场景下简牍字符检测与识别的大规模数据集。该数据集的发布,极大促进人工智能技术对简牍文献信息的理解,为简牍学搭上AI技术快车提供有力支撑。

图为DeepJiandu数据集的字符标注示例,标注框标明了字符的位置和类别。西北师范大学供图

该工作由西北师范大学简牍研究院、甘肃省简牍智能计算与数字人文工程研究中心张强教授团队负责开展,甘肃简牍博物馆、上海中西书局、甘肃文化出版社、西南大学等单位参与了该项工作。

据张强介绍,在纸张普及前的千余年中,简牍是中国古代记录历史信息的重要媒介,承载了战国、秦、汉、魏晋等时期的典籍、律令、契约等,形成了完整的文明记忆链条,简牍是文字传播的核心媒介。

然而,简牍因竹木材质易受腐蚀,尤其在出土后易出现氧化、变色或粘连问题;同时由于简牍材料的脆弱性,长期埋藏环境导致字符模糊、字迹缺损、产生畸变等问题,使得人工识别与整理这些珍贵文献极为困难。现有的数字化技术虽在甲骨文、东巴文、古彝文、古希腊铭文、古埃及象形文字、玛雅文字等相关文献资料等领域取得突破,但在简牍文献资料的智能化处理与分析程度不高,特别缺乏高质量的数据集,制约了人工智能技术在该领域的应用。

图为DeepJiandu数据集图像示例。西北师范大学供图

“DeepJiandu数据集的构建正是为了解决这一问题。”张强介绍说,研究团队通过高光谱成像、图像增强、多光谱融合等技术,确保了高质量的数据构建。数据集涵盖2242种字符类别,并由简牍学专家与计算机专家合作标注,确保数据的专业性与准确性。此外,数据集的设计考虑到简牍中字符的残损、异形字、多种布局等复杂场景,有效提升了模型对历史文献的适应能力。

DeepJiandu数据集的发布,填补了历史文献数字化与人工智能结合的空白,为简牍整理与自动识别提供了重要支持,提升考古学者对简牍文献的解读效率。此外,结合计算机视觉与历史语言学,该数据集还将推动文博机构的数字化转型,为多模态文化遗产保护提供新的技术路径。

张强表示,随着DeepJiandu数据集的推广,研究团队预计将有更多深度学习、计算机视觉领域的研究者加入简牍文献的数字化处理研究,并推动人工智能在历史文献解析、文化遗产保护等多学科交叉领域的应用。未来,团队将继续优化数据集,并探索多模态融合等前沿技术,为数字人文研究提供更强大的技术支持。

目前,DeepJiandu数据集已载入西北师范大学简牍学术资源数据共享平台。该平台已开发了实物库、释文库、字形库、著录库、文献库和专家库六个库,利用人工智能、大数据分析、虚拟现实等先进技术,完成了对4万枚西北汉简的数字化收录,不仅为专家学者提供了便捷的研究工具,也向公众展示了简牍文化的独特魅力。该平台现拥有千余名国内外在线用户,覆盖了国内外384个科研、文化机构和高等院校。(完)

相关文章

Meta买下Scale AI半壁江山,谷歌据称准备斩断合作关系

财联社6月15日讯(编辑 赵昊)据媒体报道,知情人士透露,科技巨头谷歌计划终止与Scale AI的合作关系,因为后者刚刚宣布被谷歌的竞争对手Meta Platforms收购了49%的股份。其中一位消息人士称,谷歌原本计划今年向Scale AI支付约2亿美元,用于采购人工标注的训练数据,这些数据对开发
2025-06-15 02:05:00

全国首个交通基建垂类大模型·灵筑智工亮相

工人日报-中工网记者 甘皙6月12日,成都首届垂类大模型产业大型活动——“大模型・全连接・新增长”城市论坛落幕。现场重磅发布得助大模型平台3.0、得助智能音视频服务平台3.0两大技术平台底座,推出银行、证券、汽车三大行业垂类大模型解决方案,并联合宁夏交建交通科技研究院正式发布全国首个交通基建垂类大模
2025-06-13 16:23:00

北京林业大学:3个新专业今年首次招生 ——访北京林业大学招生办主任刘芳

2025年,北京林业大学新增人工智能、大数据管理与应用、功能材料3个专业首次招生。2024年获批的“生物技术+水土保持”双学士学位项目今年首次高考招生,另外,新增1个家具设计与工程(卓越人才实验班)实验班。一、2025年学校招生政策有哪些亮点或新变化?刘芳:一是新增专业。3个新专业今年首次招生,分别
2025-06-13 16:06:00

看好公司前景和未来发展 一脉阳光核心高管自愿锁定股份

作为国内最大的第三方医学影像服务平台,一脉阳光(02522.HK)正通过"传统影响医疗+数据智能"的深度融合,打造医学影像全产业链服务平台,重塑行业未来格局。6月9日,公司发布公告,董事长及两位执行董事承诺至12月31日不减持。坚定看好公司前景和未来发展。聚焦三大增长极,夯实传统医疗智能化核心底盘通
2025-06-09 10:42:00

《政务数据共享条例》出台 如何给老百姓办实事?

近日,《政务数据共享条例》正式出台,对政务数据的目录管理、共享使用、平台支撑等工作进行部署。目的是推进政务数据安全有序高效共享利用,提升政府数字化治理能力和政务服务效能,全面建设数字政府。政务数据为什么要共享?如何实现共享?去年以来,国家数据局累计发布了70个公共数据“跑起来”示范场景,助力产业发展
2025-06-08 06:42:00

寻迹简牍历史长河 点亮科技创新星火

近日,土门墩街道河湾堡社区开展了以“寻迹简牍历史长河,点亮科技创新星火”为主题的活动,组织科技工作者走进甘肃简牍博物馆,为平日奋战在科研与科普一线的他们送上关心与慰问。活动当天,科技工作者和科普志愿者们满怀期待地走进甘肃简牍博物馆。在专业讲解员的带领下,大家依次参观了“简牍时代”“简述丝路”“边塞人
2025-06-07 14:30:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5