[返回科技频道首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
AI破解古文字登Nature封面:修复缺失文字 精确地理位置和书写时间
送交者: 神游八荒[♂★★声望品衔10★★♂] 于 2022-03-10 9:15 已读 2565 次  

神游八荒的个人频道

最新一期的Nature封面,AI再度来到舞台中央,这一次是在破译古文字方面立功了。

这是一种基于Transformer架构的方法,由DeepMind、谷歌、牛津大学等多家研究机构联合开发。 6park.com

6park.com

在单独修复受损文本时,这种方法能达到62%的准确率。 6park.com

在实际应用中,历史学家单独破译某块古希腊石碑的准确率本来只有25%,但在使用这一方法后一举提升了近乎3倍,达到了72%。 6park.com

不仅能修复文字,这一方法在地理归属的任务上也有71%的准确率,还能将古文字的书写日期精确到30年以内。 6park.com

目前,这一方法已经引起了不小的讨论热度: 6park.com

6park.com

现在已经有可以在线解析古希腊文字的网页版,架构方法也已开源。 6park.com

6park.com

Transformer破译古文字 6park.com

这是一个叫做Ithaca的架构,以荷马史诗《奥德赛》中的希腊岛屿命名。 6park.com

Ithaca架构中的注意力机制能够通过串联输入的单个字符、完整单词的表征与顺序位置来了解输入文本的每一部分的位置,最终权衡不同的输入对模型决策过程的影响。 6park.com

完整架构由多个Transformer块组成,每个Transformer块都输出一个经过处理的表征序列(Sequence of Processed Representations),其长度即输入字符的数量。 6park.com

其输入随后被传递给三个分别负责文字修复、地理归属、时间归属的任务头,每个头都由一个前馈的神经网络组成,专门负责各自任务的训练。 6park.com

6park.com

在文字修复任务中,Ithaca会提供20个按概率排列的解析结果预测: 6park.com

6park.com

地理归属的确定上,则会依据古历史学中的84个区域中对输入文本进行分类,将可能的区域预测类别通过地图和柱状图展现: 6park.com

6park.com

日期归属任务同样也通过分布预测的柱状图来展示。 6park.com

如下图所示,公元前300-250年的日期10年一组,被表示为5个概率相同的范围,而公元前305年的铭文将以100%的概率被分配到公元前300-310年的十年组: 6park.com

6park.com

历史学家的AI助手 6park.com

研究人员分别将Ithaca与历史学家、同类AI方法Pythia、以及Ithaca与历史学家合作等不同破解古文字的方法做了对比。 6park.com

字错率(CER)总是越低越好,在文字修复任务上,Ithaca的字错率和准确率都最好,如果与历史学家合作时,效果还将再次提升。 6park.com

6park.com

在论文的最后,研究人员表示,研究方法适用于手稿学、钱币学和纸草学等所有与古代文本相关的学科,也适用于古代、现代的任何语言。 6park.com

目前,这一方法已经投入了实际使用,比如在雅典时期颁布的某个重要法令的碑文的日期确认上,历史学家们之前认为是在公元前446/5年之前书写的。 6park.com

而Ithaca与历史学家一起,将这一日期更新到了公元前424/3 年: 6park.com

6park.com

Ithaca现在提供了在线试用的途径,登录官网,在方框中中输入古希腊铭文,将缺少的字符标记为破折号(-),将预测的字符标记为问号(?)。 6park.com

6park.com

每次查询最多可以预测10个连续或非连续的问号,点击查询后将在下方显示文本缺失的字符,并将其归属到原来的地点和时间: 6park.com

6park.com

作者介绍 6park.com

研究由DeepMind、威尼斯卡福斯卡里大学(Ca’ Foscari University of Venice)、哈佛大学、雅典经商大学 (Athens University of Economics and Business)、谷歌几家AI团队合作开发。 6park.com

论文有两位共同一作,其中annis Assael为DeepMind的AI部门的研究员,硕博都毕业于牛津大学,同时也是福布斯“30岁以下30名欧洲杰出科学家”之一: 6park.com

6park.com

共同一作Thea Sommerschield则是一位历史学家,目前任威尼斯佛斯卡里大学的人文科学院,以及哈佛大学希腊研究中心的研究员,主要研究领域是将机器学习应用于研究古代地中海的书面文化。 6park.com

喜欢神游八荒朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 神游八荒的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回科技频道首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]