讯飞星火V2.0打破代码能力一个指令生成贪吃蛇游戏10分钟开拓“凌空手写”_星火_模子

2024-12-12 02:53:48 文字写作

作者 | 程茜

讯飞星火V2.0打破代码能力一个指令生成贪吃蛇游戏10分钟开拓“凌空手写”_星火_模子文字写作

编辑 | 漠影

讯飞星火大模型又双叒更新了！

智东西8月15日宣布，讯飞星火大模型迎来年内第二次重磅升级，V2.0来了！

星火大模型V2.0紧张升级点表示在代码能力、多模态交互上，科大讯飞董事长刘庆峰谈道，大模型的代码能力是连接数字天下的关键支撑，多模态是让通用人工智能赋能工业的各种详细场景，未来进入家庭的最主要核心能力。

同时，本日正值七部委联合发布的《天生式人工智能做事管理暂行办法》正式实施。
刘庆峰认为，通用人工智能在深度赋能千行百业的过程中，已经迈上了新的台阶。

星火大模型的运用落地也正在稳步向前，5月6日星火大模型发布以来，科大讯飞人工智能开放平台新增了70万个开拓者团队；讯飞星火小助手6月9日发布至今，已经新增了7800多个用户自己创建的小助手；讯飞学习机5月销量同比上涨了超100%，6月上涨超200%……

这一过程中，用户体验又再反向提升大模型的能力，使得星火大模型的措辞理解、逻辑推理的测试得分不断提高。

可以看出，通用人工智能时期的发展，正在让各行各业的人都能开释自己的想象力，并通过大模型的能力将其快速实现，每个人都拥有个人AI助手的愿景正越来越近。

一、代码、多模态交互两大能力重磅升级，文本天生、理解能力持续提升

一如既往，开场星火就写了份欢迎词。
星火首先回顾了星火大模型前两次升级的内容，不同于之前的泛泛通用型先容，而是有理有据的个人知识的学习。

在办理数学能力上也大幅升级，星火能综合利用三角函数、方程、等差数列方面的知识来办理数学问题。

诗句理解上，星火可以给出“与尔同消万古愁”的出处，并写出全诗。
同时还能赏析《将进酒》中的诗句，并利用这两句诗写出一篇范例作文。

星火还能“立人设”，将它设定为“虚拟陪伴伙伴”，它就可以为用户的party（聚会）提出制作哪些美食、举办哪些活动的建议。

用户日常体验中，还可以通过语音直接对话，仿照真人“面对面”互换。

1、五大代码能力升级，几分钟天生“饕餮蛇”小游戏

到了最重磅的代码能力展示环节，刘庆峰谈道，代码能力是认知智能大模型聪慧提升的关键维度，在提升这一能力时可以同步提升长文本理解、逻辑推理、任务方案能力，以及帮助用户实行繁芜任务、连接数字天下，还能降落数字经济的创业门槛。

星火大模型包含代码天生、代码补齐、代码纠错、代码阐明、单元测试天生五大代码能力。

在代码能力展示环节，星火都是现场写代码、现场运行。

刚开始，星火就快速展示了其利用python天生了“判断输入字符串是否符合密码规则”、画出“赤色的心形线”等功能。

随后，演示职员还增加了指令，如果输入密码不符合规则时给出情由，天生的代码就会相应给出“不少于8位”等缘故原由方便用户调度。

同时，星火还能快速将视频片段转化成GIF动图，并且动图也会相应的缩小文件大小，方便用户发送分享。
星火天生经典的饕餮蛇小游戏，包含72行代码，并且每一段都给出了干系的注释。

这一代码能力也已经集成到讯飞星火的小助手中，例如助手中央中的“python大脑”小助手，这一小助手被设定为先解释、再举例、末了列出把稳事变的三段论，星火就可以根据用户的提问给出答案。

基于OpenAI构建的代码能力公开测试集HumanEval和认知智能全国重点实验室构建的代码实用场景测试集iflyCT-py，星火在python措辞下，代码天生和代码补齐能力超过ChatGPT，其它能力正在快速赶超ChatGPT。

2、图像理解能力明显领先，数字人形象、音视频轨道一气呵成

多模态能力是赋能千行百业的刚需，也是实现通用人工智能的必经之路。

去年1月，科大讯飞提出了未来10年的登月操持，便是懂知识、善学习、能进化，让机器人走进每个家庭，这中间最主要的技能便是多模态的感知、多维表达、深度理解。

大模型的多模态能力包含图像描述、图像理解、图像推理、识图创作、文图天生、虚拟人合成。
当演示职员输入风景图、萌宠图、家庭场景图片时，星火都能对图片中的紧张物体、人物进行描述，还辅以环境氛围的表述。
如果用户想要合营图片发朋友圈，星火还能给出朋友圈文案。

此外，星火还支持用户现场拍照，将图片上传进行描述。

刘庆峰谈道，在海内业界公开可测的大模型中，星火对图像的理解能力明显领先。

在文图天生能力方面，不管是“阳光下的小女孩愉快的笑着”的人物图片，还是“雪山壮丽景致”的风景图，星火都能胜任，用户还可以追加在雪山图片中加入“一个小女孩在登山”的元素。

多模态合成能力中，星火一举撑起结案牍、后期、剪辑、配音……的事情，当让它“创作一篇立秋抒怀散文，并用一个短发民国风的女生形象天生视频”，讯飞小助手就可以快速天生视频，用户还能变更数字人的形象、声音、视频的背景。

整体来看，讯飞星火大模型各项能力表现精良，在海内主流大模型测评榜上，其“智商”排名也名列前茅。
8月12日，8月12日，新华社研究院中国企业发展研究中央发布的《人工智能大模型体验报告2.0》中，讯飞星火以1013分位列本次国产主流大模型测评榜榜首，在“智商指数”和“工具提效指数”两个维度得到第一。

二、星火化身资深代码工程师、剪辑师、口语老师、助教……

与此同时，科大讯飞正在将大模型的强大能力打造成用户快速可用的产品。

1、iFlyCode：零代码根本也能编程？10分钟开拓“凌空手写”运用

基于星火大模型的强大代码能力，讯飞推出智能编程助手iFlyCode，五项代码能力也已经无缝集成到用户的开拓环境中。

演示现场，iFlyCode接到的第一项任务便是“开拓凌空手写的运用”。

首先，iFlyCode给出了一些实现的思路，开拓者须要采集视频流、手部紧张点位检测、侦测捏动手势、天生轨迹点。
随后，它给出了详细的实现步骤，用户可以直接点击步骤，调用干系的代码、函数来赞助完成运用开拓。

一开始，iFlyCode赞助天生的运用中，用户手部的关键帧时独立的点。
基于星火的修正代码能力，用户可以选中全体代码，输入“将轨迹点颜色改为黄色，用线条连接”的修正代码命令。
改完后，用户还可以快速比较修正前后的代码然后进行快速更换。

刘庆峰感慨道，结合星火大模型的能力，用python代码完备实现凌空手写的运用开拓只须要10分钟内，之前有履历的代码工程师可能须要半天才能完成。
他补充说，讯飞内部已经有2000多个员工开始利用这一代码工具，工程师的采取率提升了30%以上。

2、讯飞智作2.0：后期剪辑、配音演员、文案编辑，一个工具统统办理

基于星火大模型的多模态能力，讯飞升级了讯飞智作。

讯飞智作是讯飞2017年推出的虚拟形象配音产品，刘庆峰谈道，冬奥会、大运会、天下田径运动会吉祥物的语音都是讯飞创建的，现在讯飞将虚拟形象配音的能力开放出来。
讯飞智作2.0升级了AI后期和创意视频两个功能。

AI后期功能中，讯飞智作可以为视频天生文案、配音。
例如“用散文风格描写泾县桃花潭夏末秋初晨雾弥漫的美景”，用户可以输入视频配文的主题、选择配音主播形象、声音。
然后讯飞智作就可以将笔墨和画面对齐天生视频。

创意视频中，用户可以直接输入视频哀求、上传干系的图片。
当企业想要天生黄山毛峰的宣扬视频时，可以先让讯飞智作天生一段“包含茶叶的产地、包装、光荣等特点”的宣扬文案，然后基于用户上传的配图和讯飞智作利用AI天生的干系图片来天生视频。

这样一来，企业不须要花很大代价去拍摄干系的视频和图片，就能快速天生宣扬视频。

3、星火语伴2.0：随手拍就能口语对话，仿照真人雅思考官

星火语伴2.0全新升级，能让用户练习口语时实现更深入的互换，用户可以选择感兴趣的场景进行互换，对话结束后，星火语伴还会天生一个对话小结。

为了让对话互换和日常生活的关联度更密切，用户还可以拍摄自己手边书上的内容来进行互换，这也能让星火语伴有更丰富的口语对话来源。

此外，还有大学生普遍须要的四六级、雅思、托福等，星火语伴可以仿照更加真实的人机互测，让用户与雅思考官仿照面对面对话。
测试结束后，该运用还会给出用户准确度的得分，并给出相应的推举课程。

场景理解的大模型对话能力加持下，浩瀚领域的事情职员都可以通过大模型的能力来提升事情效率。

4、星火西席助手：帮老师做课件、支配作业，还能一键天生教室思维导图

讯飞畅言聪慧教室已经落地到全国1200多万师生中，基于人工智能可以剖析学生的情形，实现因材施教。
目前，全国教诲开始实现以素养培养为核心的教诲“三新”改革，这一过程中，西席会面临单元教诲方案下创新难、传授教化活动设计资源少、课件制作包袱重的难题。

因此，针对上述三大难题，星火西席助手可以帮助西席完玉成部备课环节。

星火西席助手能快速天生相应主题的教室设计文档，同时，西席还可以在已天生的环节中添加活动。
一样平常而言，西席想要达到空想的教堂授课效果，还须要大量精力去领悟其它素材。
现在，这一助手能基于传授教化设计、大模型的理解能力，帮助老师一键天生课件，并根据传授教化内容自动添补干系多媒体内容，还会加入对应的图片、视频、表格。

活动小结中，星火西席助手还能天生思维导图，帮助学生提升构造化思维能力。

三、大模型深入行业运用，联合华为发布星火一体机

本日，国家首次针对天生式人工智能家当发布的规范性政策《天生式人工智能做事管理暂行办法》正式实施，这一《办法》对供应和利用天生式人工智能做事的总体哀求进行了明确。
与此同时，这也标志着海内已发布的上百个大模型已开启运用落地PK战。

科大讯飞的大模型运用落地已经走在前列。
早在2022年底，科大讯飞就正式启动了“1+N”认知大模型专项攻关，“1”是通用认知智能大模型，“N”是大模型在教诲、办公、汽车、人机交互等领域的落地，以行业运用为导向的布局也与家当变革相契合。

当下，讯飞已经和汽车、金融等行业达成互助，汽车厂商奇瑞搭载星火大模型的产品即将发布。
在教诲领域，讯飞学习机的销量大幅上涨，今年5月至今同比增长了180%。
刘庆峰谈道，讯飞要做的便是将大模型赋能到类似行业中的相应场景。

除此以外，认知大模型的深度赋能时期已经到来，现在的大模型参与者不仅要看到技能能做什么，还要构建一个康健安全的家当推广环节和能力保障，刘庆峰认为，这聚焦于三大关键要素，分别是安全可控、场景驱动和专属模型。

个中安全可控紧张包含内容和算力的安全。
内容安全指的是天生内容的代价不雅观、准确度都要安全，内容不屈安会导致污语料、“幻觉”涌现，如果大模型学习的是不干净、缺点的数据，就会导致天生结果是有问题的。

科大讯飞承建了语音及措辞国家工程技能中央，可以面向全天下网络信息，然后通过语种、质量、隐私、安全等判别器来洗濯得到高质量语料。

在算力安全方面，科大讯飞和华为联合，将高算力、高性能的算子库、多卡高速互联和分布式存储相结合，在此根本上打造训推一体设计的自研大模型演习平台。
刘庆峰透露，该平台单卡算力已经开始对标英伟达A100芯片。

场景驱动方面，便是要让大模型在看得见摸得着的场景上产生实实在在的运用代价。

专属模型，讯飞和华为正在联合打造大模型演习国产算力集群，包含5种定制优化工具，企业可以直接打包开拓，有了这些能力，企业就可以打造自己的专属大模型。

本日，科大讯飞联合华为发布了帮助企业快速支配的星火一体机。
这一设备既许可企业从头到尾演习大模型，也能基于讯飞星火大模型针对场景快速优化。