[返回电脑前线首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
国产AI来炸场了,媲美Sora的阿里EMO全量免费上线
送交者: gonewithsmoke[☆★★★声望勋衔15★★★☆] 于 2024-04-27 19:47 已读 8729 次 1 赞  

gonewithsmoke的个人频道

一张照片就能唱歌,阿里EMO免费上线 6park.com

万万没想到,国产AI技术的更新迭代真的是太快了。 6park.com

在ChatGPT的余晖尚未消散之际,OpenAI携Sora横空出世。凭借精准捕捉指令、细腻构建场景、逼真演绎动态的卓越能力,Sora被部分业内人士称其 “人工智能领域的一次突破”。逼真的画面令人很难区分它们是由实拍而得,还是由AI生成。 6park.com

让人惊讶的是,不少人还在被Sora的视频生成能力征服,而国产大模型已经悄悄带来新的变化。 6park.com

早在今年2月份,阿里巴巴发布了一款全新的生成式AI模型EMO,并且公布了技术论文。 6park.com

6park.com

EMO生成视频案例 6park.com

具体来说,EMO不仅能够生成唱歌和说话的视频,还能在保持角色身份稳定性的同时,根据输入音频的长度生成不同时长的视频。 6park.com

而EMO的视频效果,真的让人一愣一愣的。 6park.com

比如我们上传一张伏地魔的照片,EMO便能制作出他正在唱歌的真实视频,而且形象逼真。仔细观察EMO产出的视频,可以发现人物的口型与背景音乐的同步性极佳,表情变化也十分丰富,使得角色仿佛赋予了生命,整体效果令人印象深刻。 6park.com

这样的效果自然引发了很多海外用户、科技巨头的惊叹,大家震惊于EMO的技术实力直逼Sora,EMO也随之成为继Sora之后最受关注的AI模型之一。 6park.com

很多网友纷纷感叹:“我们正在走进一个新的现实!” 6park.com

6park.com

EMO掀起用户讨论热潮 6park.com

随着EMO模型在技术圈的火爆,为了让所有人都能体验到EMO的强大功能,阿里通义实验室,决定将其全面开放给所有人:4月25日,EMO上线通义APP,阿里通义实验室将其免费集成至通义APP的“全民舞台”频道,所有用户均可免费使用。 6park.com

在我们实际体验之后发现,这个国产AI工具比论文中的使用步骤还简单。从一张安静的图片,到一个活生生、会唱歌、会讲段子的“人“,只需要十几分钟的时间。 6park.com

毫无疑问,EMO的诞生以及媲美Sora的技术能力,标志着中国AI大模型持续走在行业前列,正在与国际巨头并驾齐驱。 6park.com

6park.com

国产AI进化速度快的吓人 6park.com

实际上,在Sora模型推出之后,曾有人担忧国产AI无法跟上步伐。有很多人认为:国产AI与Sora之间的差距越来越大。 6park.com

我们必须承认,国产AI与美国大模型之间的差距的确存在,而明确差距的下一步,就是加速追赶。 6park.com

目前来看,国产AI在语言模型、视频生成模型、视觉理解模型等很多领域都在加速追赶,像EMO就在音频生成视频的领域做到了业界首创。 6park.com

几个月之前,国产AI也做过类似的视频生成工作。当时,整体生成的视频时间比较短,基本在10秒以内,并且视频中经常出现错误,不连贯,视频生成的速度也很慢。 6park.com

可是万万没想到,几个月之后,当前的国产大模型就已经实现分钟级别的audio2video生成,并且视频的形象逼真,人物的表情变化也十分丰富。 6park.com

6park.com

同样以阿里EMO模型为例: 6park.com

从今年2月份放开技术论文到现在,仅仅过去不到2个月的时间,EMO就实现了低门槛使用、全量免费上线等创新体验。 6park.com

我们实际体验发现,生成一段伏地魔唱歌的视频,只需要等待10分钟左右,即可完成。 6park.com

令人惊艳的技术迭代速度,才是国产AI的真正实力所在。有外媒评论,talking head技术虽然才出现两三年,但EMO一下子让以前的技术方案变成了“老古董”。 6park.com

具体来说,EMO是一种富有表现力的音频驱动的肖像视频生成框架,可以根据输入视频的长度生成任何持续时间的视频。区别于Sora的文生视频技术,这种音频驱动的肖像视频框架,无需建模就可驱动肖像开口说话,不仅降低了视频生成成本,还大幅提升了视频生成质量。 6park.com

毫不夸张地说,我国视频生成技术正在步入崭新的2.0时代,加速缩小与国际先进水平的差距。 6park.com

6park.com

见证历史,见证国产AI的奇迹 6park.com

不难看出,国产AI大模型与行业先进技术并驾齐驱。以EMO模型和通义APP为代表的国产AI,在AI行业的激烈争夺中,持续突破技术壁垒。 6park.com

而目前国内互联网巨头的大部分大模型都达到或者超过了GPT3.5的能力,全世界也只有中国有这个能力。 6park.com

诸多行业相关数据也在证实,中国已经成为AI成果和AI专利方面的全球领导者。 6park.com

来自斯坦福大学人工智能研究院AI Index报告显示,在AI专利方面,中国处于领先位置。2022年,中国以61.1%的比例领跑全球AI专利来源地,远超美国(20.9%)。对比2010年,当时美国在AI专利方面的占比高达54.1%。 6park.com

国家工业信息安全发展研究中心和工信部电子知识产权中心联合发布的《新一代人工智能专利技术分析报告》同样显示,我国成为全球AI技术创新重要竞争者。 6park.com

与此同时,国产AI的爆发,也在持续点燃普通用户的参与热情。 6park.com

数据显示,视频生成模型EMO刚刚上线仅一天的时间,就吸引了400多万用户前来使用体验,其应用全量开放的瞬间,通义APP甚至一度被挤爆,需要排队数小时。 6park.com

6park.com

图源:通义千问APP 6park.com

除了EMO模型的惊艳之外,越来越多的AI创新应用,也在一步步走到我们身边。 6park.com

前段时间,一款名为“全民舞王”的现象级应用在社交平台上引发热议,用户们纷纷利用该应用让兵马俑跳出科目三的舞步,创意玩法层出不穷,热度持续飙升。除此之外,通义APP也陆续推出了超长文档解析、AI编码助手、AI会议助手等一系列免费且实用的功能,让人工智能真正融入日常生活,提升效率,丰富娱乐体验。 6park.com

从某种意义上来说,国产AI带来的新一轮工业革命已经开始了。 6park.com

而作为普通人的我们,正共同见证国产AI行业的蓬勃发展,每一个人都在亲历这一历史性的技术变革,共享国产AI创造的奇迹。
喜欢gonewithsmoke朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ gonewithsmoke的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回电脑前线首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]