3月12日,华为公布了首个AI图像生成模型PixArt-Σ的论文,克隆数字分身的D-IDAgent近期也爆红,这些产品都拓宽了我们对AI的想象。华为实验团队在平台上发布了多篇论文,展示了PixArt-Σ技术,此外用户只需要在D-IDAgent上传一张照片就能生成AI数字人,这些高新技术实现了很多需求。
华为首个 AI 图像生成模型PixArt-Σ亮相
PixArt-Σ的前身是PixArt-α,相较之下PixArt-Σ的各个方面都有了很大的提升,包括数据质量、图像生成质量、训练效率等,PixArt-Σ技术的参数规模是6亿,通过这项技术嗯呢乖直接生成AI图像,图像的分辨率能达到4K。与此同时,PixArt-Σ能将现有的文本优化到图像扩散的模型当中,在电影、游戏等行业能体现出更高质量的视觉效果。
D-IDAgent能成功克隆自己的数字分身
D-ID平台推出的D-IDAgent应用近期受到大家的关注,在极短的时间内火爆全网,通过D-IDAgent能定制出自己的AI化身,简单的操作能满足用户对生成AI效果的不同需求。生成的数字人可以进行人性化的交互,数字人在接收到指令之后,能通过手势、表情、语言等作出回应,丰富的使用场景让这个程序应用范围特别广泛,数字人可以进行直播、代言、推广等,直接用数字人来代替真人进行拍摄,对于使用者而言能大大降低视频的制作成本。
除了PixArt-Σ和D-IDAgent外,免费的AI神器还有Chat Musician,能生成各种音乐,VSP-LLM能读唇语,直接将视频里人物的说话内容识别翻译出来,MIRAGE能帮助人们完成医学问答,涵盖医学领域的很多知识和要点,通过检索就能找到答案,整体的准确性很高。这几个AI神器给我们的工作和生活都带来无法想象的便捷,也让我们看到了AI的神奇之处。