人人皆可“一语成画”AI作画神器来了_模子_画作
文心·一格为艺术创想插上科技羽翼,大家都能成为“艺术家”
人学习作画一样平常得从基本功练起,大体上包括线条、色彩、明暗、形体、构造、透视、构图和空间。要想画得出众,除了日积月累勤奋练习,还须要一些天赋,以及对天下的风雅不雅观察和创作者独特的创想。这让大部分人只能当画作的不雅观赏者而非创作者。但是,随着深度学习、大模型等技能的发展,AI 能够在极短的韶光内“创造”出不同风格的画作,大幅降落了作画的门槛,让大家都能成为“艺术家”。
文心·一格是基于文心大模型的文生图系统实现的产品化创新。在文心·一格官网,用户只需输入自己的创想笔墨,并选择期望的画作风格,即可快速获取由一格天生的相应画作。官网资料显示,文心·一格现已支持国风、油画、水彩、水粉、动漫、写实等十余种不同风格高清画作的天生,还支持不同的画幅选择。
文心·一格面向的用户人群非常广泛。它既能启示画师、设计师、艺术家等专业视觉内容创作者的灵感,赞助其进行艺术创作,还能为媒体、作者等笔墨内容创作者供应高质量、高效率的配图。此外,文心·一格更是为大众用户供应了一个零门槛绘画创作平台,让每个人都能展现个性化格调,享受艺术创作的乐趣。
文心·一格背后的跨模态大模型技能与系统创新
吴甜表示,数据的井喷式增长、算力的持续打破、算法的持续创新为人工智能带来新机遇,预演习大模型凭借优胜的泛化性、通用性和运用效果,成为人工智能发展的主要方向。跨模态大模型是在技能发展和家当实践中孕育而出的,也是百度文心知识增强大模型面向家当运用持续创新及培植的主要方向。
面对日益增长的内容创作须要,如何准确理解用户需求,进而精准刻画并知足多样化风格、高质量天生的哀求是技能要办理的关键寻衅。文心知识增强跨模态理解大模型在模型创新方面,提出基于多视角比拟学习的ERNIE-ViL 2.0,在预演习过程能够同时学习模态间和模态内的多种关联性,提升“图像”和“文本”跨模态语义匹配效果。知识增强跨模态图文天生大模型ERNIE-ViLG,将“文天生图”和“图天生文”任务领悟到同一个模型进行端到端学习,从而增强文本和图像的跨模态语义对齐。在这次CCIG 2022会上,吴甜还分享了ERNIE-ViLG文图天生算法的升级,通过渐进式扩散模型,天生空间由小及大、天生轮廓由粗到细,同时根据天生阶段自动选择最优天生网络,文本天生图像的效果取得进一步提升。
新技能在家当实践中运用并创造出代价必须要足够实用化。因此,百度基于文心大模型进行了系统创新,研发了支持AI作画的文生图系统,供应了从用户需求理解到知足的全流程办理方案。首先,基于知识的Prompt工程,理解用户需求并在此根本上丰富语义细节,降落用户输入描述本钱。其次,基于扩散天生算法实现创意写实与恢弘构图的艺术画作天生。末了,基于跨模态匹配大模型进行天生画作的结果排序,自动选出语义与都雅度最佳的画作。
从技能创新到系统创新再到产品化创新,这一体系性的创新得益于飞桨家当级深度学习平台的夯实有力支撑。飞桨的端到端自适应分布式演习技能、4D稠浊并行策略、对异构硬件的自适应并行支持,熬炼出框架与算力、算法相结合三位一体的大模型演习上风。飞桨的自动模型压缩工具、自适应分布式推理技能,更是大幅节约了机器资源,让大模型的支配更加高效、便捷,能真正落地运用。
吴甜认为,新技能运用于场景,须要从根本算法、技能系统、工程平台多方面同时创新,文心·一格便是依托于多项新技能综合创新的产品。
除了推出一格这样的AI艺术和创意赞助平台,文心跨模态大模型还为广大开拓者、科技爱好者供应了飞桨开源工具和API做事能力,知足开拓者灵巧探索等需求。对灵巧性需求更高的开拓者,可以利用飞桨的开源工具PaddleHub基于文图天生开源算法极简开拓,并完成模型的管理和一键预测。对便捷性需求更高的开拓者,可以利用文心ERNIE-ViLG API,极速得到沉浸式文图天生大模型的技能体验,更可灵巧方便、高效地实现产品集成。
据理解,为了帮助更多行业用户清晰理解、轻松运用基于大模型技能的AIGC能力,百度飞桨文心大模型已在8月开设AIGC系列公开课,课程深入浅出、体系全面并配套丰富的实践资源。
让机器具备超过文本、图像等多种模态的繁芜场景理解与天生能力,是人工智能的主要目标之一,也是数字时期科技与家当深度领悟创新,催生新业态新模式,加快家当智能化升级的新动能。人工智能在艺术领域的学习与创作能力正以发达之势不断刷新我们的认知,同时也让"大众对科技与艺术及文化的领悟创新有了更大的想象空间。文心大模型正在成为推动AIGC(人工智能天生内容)发展的新引擎,基于文心大模型的AIGC将会带来创新性的探索,并赋能到广泛的行业领域。
来源: 光明网
本文系作者个人观点,不代表本站立场,转载请注明出处!