[返回学习园地首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
弱智吧竟成最佳中文AI训练数据?中科院等:8项测试第一……
送交者: icemessenger[♂☆★★★SuperMod★★★☆♂] 于 2024-04-16 18:54 已读 3893 次 2 赞  

icemessenger的个人频道


离大谱了,弱智吧(Ruozhiba)登上正经AI论文,还成了最好的中文训练数据?




弱智吧是一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的: 6park.com

Ruozhiba, which literally translates to “Idiot Sub-forum”, is a bizarre corner of the Chinese internet. This sub-forum on Reddit-like Baidu Tieba is filled with ridiculous, pun-filled, logically challenging threads that will twist your brain into a pretzel.




近日,中科院深圳先进技术研究院、中科院自动化研究所、北京大学、滑铁卢大学等知名高校和机构成员发表的论文“COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning”(COIG-CQIA:质量是中文指令微调最需要的),该论文选用了弱智吧等中文互联网社区作为数据来源,经转载和解读后走红网络。




该论文指出现有的中文指令微调数据集所存在的问题: 6park.com

中文独特的语言特点和深厚的文化底蕴给指令微调任务带来了挑战。 6park.com

The unique linguistic features and cultural depth of the Chinese language pose challenges for instruction tuning tasks. 6park.com

现有的中文指令微调数据集存在一些固有问题,如不自然的中文交流模式、缺乏真正的中文语言数据、包含大量有问题的数据点、数据规模较小等。 6park.com

The available datasets for Chinese instruction tuning have inherent issues such as not aligning with natural Chinese communication patterns, lacking genuine Chinese linguistic data, containing numerous problematic data points, and having small-scale data. 6park.com

因此,该团队从中文互联网上的各种来源收集了高质量的人工写作语料。 6park.com

Therefore, the research team collects a high-quality human-written corpus from various sources on the Chinese Internet, including Q&A communities, Wikis, examinations. 6park.com

具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。 6park.com

经过对语料的严格清晰和认真处理后,形成了 COIG-CQIA 数据集。 6park.com

This corpus was rigorously filtered and carefully processed to form the COIG-CQIA dataset. 6park.com

而真正引爆网友好奇心的,是该团队开展的一项“电子斗蛐蛐”。 6park.com

经过深入评估和分析,论文作者在 CQIA 的不同子集上训练了各种规模的模型。 6park.com

该研究团队筛选了CQIA的一个数据子集,用它和这些不同来源的数据集分别来训练 Yi-6B,再通过 BELLE-EVAL 使用 GPT4 进行评估。而令人大跌眼镜的是使用“弱智吧”数据训练出来的模型,在总体评分上位列第三,在多项指标上表现优异。




在安全评估方面,弱智吧数据训练出来的模型也仅次于从本次研究成果CQIA精选出来的数据子集:




对于“弱智吧”的优异表现,研究团队也做出了猜测: 6park.com

在所有子集中,“弱智吧”平均排名第二。我们推测,这是因为它可能会增强模型的逻辑推理能力,从而使大多数指令跟踪任务受益。Ruozhiba ranks second on average across all subsets. We conjecture this is because it may enhance the model’s logical reasoning ability, thereby benefiting most of the instruct-following tasks. 6park.com

对此,许多网友也发表了自己的看法:“果然人类最后的防线是抽象。”


6park.com

6park.com



在中文大模型向公众开放之初,人们虽然感慨其功能的强大,但也因其回答死板、答非所问等问题调侃它们为“人工智障”。但是随着大模型训练的不断推进,人工智能已然能够处理以往看似难以完成的任务,比如“AI不会画手”、“AI不懂脑筋急转弯”等问题已经逐步被解决。显然,人工智能的发展日新月异,越来越多参与到我们的日常生活之中,乃至成为不可缺失的一部分。 6park.com

你在日常生活中会使用AI工具吗?现在的AI工具满足你的期待吗?留言说说吧。


喜欢icemessenger朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ icemessenger的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回学习园地首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]