多模态AI技术突破最新进展
编号:2299 分类:互联网资讯 阅读: 时间:2024-03-01

MobileAgent是由阿里巴巴开发的一个自主多模态AI代理,旨在模拟人类操作手机,这是一个纯视觉解决方案,无需依赖任何系统代码,完全通过分析图像来理解和操作手机。该项目的特点在于其依赖于纯视觉解决方案,通过分析图像实现对手机的理解和操作,无需借助系统代码。

mg src="https://img.hkspa.top/zdmsl/20240301161418_23734.jpg"/ loading="lazy">

MobileAgent采用"观察、思考和行动"这一提示格式,要求代理输出三个组成部分,实现对手机的操作。这种设计使得MobileAgent能够更加智能地模拟人类的操作方式,从而提高了用户体验。

网址推荐 网址推荐