[返回经济观察首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
从AI大模型的差距谈起
送交者: 鹿特丹丹[☆★声望品衔8★☆] 于 2024-02-24 16:43 已读 1544 次  

鹿特丹丹的个人频道

从中美AI大模型的差距谈起 6park.com

匿名 6park.com

ChatGPT3.5 刚推出的时候, 中国的百度等公司表示, 它们的大模型就比美国的晚三个月。 今天, OpenAI SORA横空出世, 中国的大tech公司哑然失声。有人估计中国的AI大模型已经被甩开几年。这可能不是耸人听闻。 6park.com

大模型的supervised 训练的设计很有讲究。 搞得好,它会引导机器有效地深入地掌握人类知识的方方面面,培养逻辑推理能力等 AGI 的硬核能力。搞不好, supervised 训练会让机器迷失在浩瀚的知识海洋里, 变成人工智障。中国的AI公司需要好好看看它们的大模型是往那个方向去。 6park.com

普通人可能对此缺乏认识, 以为喂同样的知识给机器, 就会产生同样的智能。事情不是这么简单。一个类比是,一本同样的教科书, 给一拨人学习, 不同的人对书本掌握理解的程度相差很大: 有的人了如指掌, 有的人如坠云雾。 6park.com

一个有启发性的例子如下。哈佛博士陈琳当年作为计算机大二生, 用三个月时间, 自己喂自己包括量子力学在内的物理专业核心教科书, 在学校的选拔考试中脱颖而出,甩开物理系师生, 被推荐参加丁肇中研究生招考。而许多物理系学生读了四年到毕业,都没能掌握量子力学。虽然他们看的是同一本书。 6park.com

现在有一种可能性是, openai 的 大模型开挂了, 扬帆而去,像当年的大二生陈琳; 而中国的大模型,更像几年都没读懂量子力学的学生。虽然,大模型的神经网络构架是一样的, 虽然参数估计的算法是公开的。 6park.com

差别在于supervised 学习的设计。设计好的supervised 学习方法, 对开发者的学术背景有很高的要求。开发者最好能掌握多个专业知识, 并且融会贯通。 6park.com

比如 SORA团队的领导人,Tim Brooks ,就具有多个专业背景。他是加州伯克利计算机博士,演员( 曾在百老汇演出),摄影师( 获得国家地理杂志奖) 。显然是一个专业精湛, 兴趣广泛, 心智非常活泼的人。 6park.com

中国缺的就是这种领军型人才。专业精湛的, 大多兴趣狭窄, 除了专业外, 几乎一无所知。兴趣广泛点的, 流于肤浅。上文提到的哈佛博士是个例外。他既精湛又广博,拥有中美最好大学的计算机, 天体物理, 计算社会学, 公共管理等不同专业学位, 同时还是一个专业画师。这样的人,是今天第四次工业革命的佼佼者。中国的AI大模型, 先是落后几个月,继而落后几年, 缺的就是像陈博士这样的人。阿里,腾讯, 百度, 如果请他出山领导AI团队, 则有望收复失地, 迎头赶上。
贴主:鹿特丹丹于2024_02_24 23:10:58编辑
贴主:鹿特丹丹于2024_02_24 23:11:19编辑
喜欢鹿特丹丹朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 鹿特丹丹的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回经济观察首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

手机扫描进入,浏览分享更畅快!

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]