写真视频击败Sora-1.0震撼登场-人大自研全新多模态大模型Awaker
编号:31392 分类:互联网资讯 阅读: 时间:2024-04-30

本文报告了人工智能领域的一项重要进展:人大系初创公司智子引擎发布了名为Awaker1.0的全新多模态大模型,标志着通往通用人工智能(AGI)的重要一步。这款模型在视觉生成方面表现优异,超越了其他先进模型,如GPT-4V、Qwen-VL-Max和Intern-VL。其采用了创新的MOE架构,具备自主更新能力,能够模拟现实世界,并通过场景行为数据的反馈实现持续更新与训练。

Awaker1.0在视觉问答和业务应用任务中展现出了优异的性能,同时在描述、推理和检测任务上也取得了显著进展,证实了多任务MOE架构的有效性。结合具身智能,Awaker1.0可能为实现AGI提供一条可行路径,通过自主探索环境并提升适应性和创造性。其自主更新机制包含数据主动生成、模型反思评估和模型连续更新等关键技术,使其能够实时地持续更新参数。

写真视频击败Sora10震撼登场人大自研全新多模态 写真视频击败Sora10震撼登场人大自研全新多模态

智子引擎的自主研发类Sora视频生成底座VDT,展现了Transformer技术在视频生成领域的潜力,能够处理多种视频生成任务并在写真视频生成任务上取得优异效果。Awaker1.0的发布代表了智子引擎团队实现AGI目标的关键一步,加速多模态大模型行业的发展,有望让人类迈向实现AGI的方向。

写真视频击败Sora10震撼登场人大自研全新多模态 写真视频击败Sora10震撼登场人大自研全新多模态 写真视频击败Sora10震撼登场人大自研全新多模态

团队认为,AI的自我探索和自我反思等自主学习能力对智能水平的评估至关重要。Awaker1.0在理解和生成方面都取得了突破,将有助于推动人类实现AGI的进程。

网址推荐 网址推荐