首页 » 黑板报 » 比亚迪接入通义大模型!

比亚迪接入通义大模型!

 

未来,在比亚迪智能座舱内,只要一句话,就能实现买票点单等在线服务。

例如,当用户询问:“Hi,小迪,帮我查一下我昨天在淘宝买的东西送到哪里了。”Mobile-Agent能结合对座舱屏幕的视觉感知来准确识别淘宝App,并通过模拟点击车机屏幕,完成查询。除此之外,“帮我订一张明早去上海的火车票”、“帮我点个麦当劳外卖”、“帮我在微博打开热搜”等操作也能在比亚迪座舱中实现。

这来自阿里云AI智能体Mobile-Agent和比亚迪联合打造的AI智能座舱场景,该智能体落地座舱后,用户可通过“一句话”实现复杂操作。

Mobile-Agent采用全视觉解决方案,基于比亚迪开放座舱应用生态,结合Qwen-VL的视觉识别、推理能力构建多模态智能体,可实现对座舱屏幕智能感知、复杂任务规划以及座舱应用UI进行操作决策。Mobile-Agent具有多端、多App、多场景的操作能力,不需要根据不同App、场景做适配,具有强泛化能力

未来,在比亚迪智能座舱内,只要一句话,就能实现买票点单等在线服务。

例如,当用户询问:“Hi,小迪,帮我查一下我昨天在淘宝买的东西送到哪里了。”Mobile-Agent能结合对座舱屏幕的视觉感知来准确识别淘宝App,并通过模拟点击车机屏幕,完成查询。除此之外,“帮我订一张明早去上海的火车票”、“帮我点个麦当劳外卖”、“帮我在微博打开热搜”等操作也能在比亚迪座舱中实现。

这来自阿里云AI智能体Mobile-Agent和比亚迪联合打造的AI智能座舱场景,该智能体落地座舱后,用户可通过“一句话”实现复杂操作。

Mobile-Agent采用全视觉解决方案,基于比亚迪开放座舱应用生态,结合Qwen-VL的视觉识别、推理能力构建多模态智能体,可实现对座舱屏幕智能感知、复杂任务规划以及座舱应用UI进行操作决策。Mobile-Agent具有多端、多App、多场景的操作能力,不需要根据不同App、场景做适配,具有强泛化能力

来源:阿里云公众号

湖州甄选: https://hzzx.net/202506121

文章内容仅供参考,如有错误请发邮件指正!

Email: [email protected]

扫一扫在手机打开当前页

二维码加载中...

扫一扫关注公众号

原文链接:比亚迪接入通义大模型!,转载请注明来源!

0