图 1:受到不雅观众喜好的疗愈机器人——“大白”

让 AI 学会“读心术”见证史上最丝滑的人机交互_技巧_模子 智能助手

“大白”代表了人类对未来AI的完美设想:智能、高效且富有同理心。
这样的“梦中情 AI”究竟离我们有多远?7 月 31 日,SoundAI 声智 AI 媒体沟通会在声学未来馆举办,答案彷佛正在变得更加清晰。

本次活动以“大模型·新交互”为主题,声智科技副总裁黄赟贺公布了AzeroGPT 的算法技能升级成果,并发布了两款新品——AI 交互新品“千面智语”和AI 硬件新品“声智珍珠耳夹式耳机”。

图 2: “大模型·新交互”声智科技 AI 媒体沟通会

中国人自己的GPT-4o,给 GPT 加上“耳朵”

目前的智能体虽然已经能够理解繁芜的指令,能通过笔墨识别基本的感情,并能以笔墨的形式进行自然对话,或者用合针言音进行播报,但对人类繁芜情绪的捕捉仍不足精准,看起来不足“智能”。

声智科技在这次媒体沟通会上展示了AzeroGPT搭载的语音模型的算法升级,在与AI进行交互时,它就像装上了“耳朵”一样,能迅速、准确地“听懂”用户的意图和需求,并且以语音对话的办法,进行更快地相应,还能够通过声音通报出不同的感情和情绪。
对标 GPT-4o,让 AI 在对话中表现得像人类一样丝滑。

图 3:搭载 AzeroGPT 的小易能够迅速、准确地“听懂”用户的意图和需求

该模型已经通过国家网信办算法备案和北京市天生式人工智能做事备案,在数据处理、隐私保护、技能的安全性和稳定性等方面得到了认可。
并已成功落地运用于三甲医院智能导诊系统、机关单位智能助理、国家 5A 级景区、科技展厅智能讲解、电信运营商智能客服、大型楼宇智能电梯、公安反诈智能外呼系统等,积累了丰富的技能和做事履历,得到了客户和用户的认 可。

图 4:声智已经顺利完成“声智壹元大模型算法”、“Azero高等语音识别算法”、“Azero高等语音合成算法”三项深度合成做事算法备案,以及一项“声智壹元大模型”天生式人工智能做事备案。

超低本钱支配,打造 AI 硬件与 AI 交互家当生态

传统声学模型在喧华环境中的表现每每不尽如人意,尤其是在重叠语音、多人说话等场景下,语音识别的准确率和相应速率都会被限定住。

声智科技在本次媒体沟通会中展示了大模型在各种声学环境下无缝互换的流畅体验,通过对AI算法的升级以及Azero开拓框架的优化,显著提升了声学模型云打算的速率和准确性。

此外,本次升级还将降噪算法、声纹识别等声学算法成功转移到云打算,这一转变冲破了传统设备端支配的局限性,提升了打算效率和安全性,还有效降落了AI设备的本钱。

云打算的支配办法可以让大模型接入各种硬件设备和交互软件,用户可以通过各种接入大模型的终端设备召唤属于自己的全能 AI 伙伴。
声智面向不同的行业用户,已经开放了安全的私有化支配、可信的行业化演习,以及专业的天生式推理解决方案,打造人机交互家当生态升级,助力企业进行全域智能升级。

图 5:搭载 AzeroGPT 的智能可穿着硬件——声智珍珠耳夹式耳机在百元级耳机上实现了同声听译、语音转写、智能写作等 AI 功能

此外,AzeroGPT 拥有超高等别的数据安全和隐私保护方法,通过了环球公认的信息安全管理标准——ISO27001 认证,还通过了多个行业内公认的技能安全认证,如CCRC 信息安全做事资质认证、信息技能做事管理体系认证、信息安全管理体系认证和信息技能做事标准认证等。
声纹识别技能及设备也通过了通过公安部容许认证。
这些认证不仅是对声智技能和管理能力的认可,更是证明了 AzeroGPT 已经具备了高水平的技能能力和管理体系,能够供应稳定可靠的做事,减少因系统问题导致的业务中断风险。

图 6: 声智壹元大模型 AzeroGPT 已经通过多项备案。

“千面智语”——更通人性的交互智能体

实现“千人千面”的个性化做事一贯是AI发展的主要方向。
声智科技的新产品“千面智语”数字人交互做事,基于大模型和语音交互框架,能够根据不同用户的偏好和需求调度回应办法。

图 7: 声智AI 交互智能体新品“千面智语”发布

媒体沟通会现场为不雅观众展示了实时的拟人化互换效果。
面对儿童的提问,Azero GPT 的回答会充满童趣和大略易懂的阐明,就像一个童年玩伴一样知足少年儿童探索未知的好奇心;而与老年人互换时,会采取较慢的语速和更知心的表达办法,赞助老年人进行理解,充分展示了老年人。
此外,媒体沟通会上还展示了生理年夜夫、反诈警官、税务客服等角色,可以看到AI 在不同身份下都能进行符合该角色风格的表达,风格迥异的回答内容和声音语气,可以绕让机器人拥有足够的专属感和陪伴感,AI从此不再是一个大略的工具,更是陪伴人类的好伙伴。

图 8: AzeroGPT 面对不同的用户需求,扮演多种角色

“AI 终极形态”——海内首次在耳夹上实现人机交互

本次媒体沟通会上,海内首款“AI 配饰”——“FairyClip 声智珍珠耳夹式耳机”证明了大模型在可穿着设备上实现的可能。
这款耳机采取开放聆听技能,搭载了新一代AirAudio定向空气传音技能,音质清晰无漏音。
此外,慢回弹耳夹的设计不仅都雅,而且戴起来丝毫没有异物感,还不挑耳型,适宜各种大小和形状的耳朵。

图 9: AzeroGPT 面对不同的用户需求,扮演多种角色

耳机内置的专属AI助理,能够随时响运用户的指令,不仅可以实现转写、翻译、内容天生等针对办公学习场景的功能,还针对运动康健、日常生活的需求,供应康健数据检测、助眠音频以及生活事变提醒等功能。

此外,最新版本的声智APP-小易问问功能新增热点资扣问答能力,在 2024 巴黎奥运会期间还推出了奥运特殊版,不仅能进行更加自然的实时对话,还能供应即时的赛事信息,用户可以和小易一起,随时随地不雅观赛、追赛。

图 10: 通过耳机可以在 2024 巴黎奥运会期间实现 AI 追赛

至此,百元级别的耳机也能拥有与千元机同等的 AI 功能。
AI 算法的升级将用户利用大模型的本钱降到最低,真正做到技能普惠,大家都能享受到 AI 供应的专属做事。

AI硬件与AI交互:环球AI落地的共识

人工智能技能发展至今,AI 硬件和 AI 交互已经是环球AI技能落地的共识。
未来人工智能与声学技能的结合,将会创造出更完美的交互智能体。
它足够智能,可以无时无刻地陪伴在你的身边;它足够全能,让你的学习事情更高效;极具同理心的它,对你的理解乃至超过你身边的任何人,还能帮助你办理生活中碰着的各种问题……

就像声智 AI媒体沟通上播放的创意短剧《戴上耳机开启龙少宠溺新篇章》和《重生之我是耳机》那样,通过一枚小小耳机的视角,展示了声智团队对 AI 奇迹的热爱和追求,以及青年团队敢想敢做的态度,以当下最盛行短剧形式,表达产品设计的初心。

图 11: 由声智发布的短剧《戴上耳机开启龙少宠溺新篇章》

图 12: 由声智发布的短剧《重生之我是耳机》

明确的计策方案与前瞻性的布局、长期持续的底层技能投入以及以用户为核心的产品能力,推动声智科技年夜胆前行,让我们离梦想中的完美“大白”更近一步。