cot和tan的转化


cot和tan的转化  

随着AI智能技术的飞速发展,新能源汽车已成为公众紧密关联的最佳载体。5月7日,理想汽车发布了令人瞩目的“理想AI Talk第二季——理想VLA司机大模型,从动物进化到人类”的分享会。理想汽车董事长兼CEO李想重点介绍了人工智能的最新思考,详细阐述了VLA司机大模型的作用、训练方法和挑战。

李想将AI工具分为三个层级:信息工具、辅助工具和生产工具。目前,大多数人主要将AI作为信息工具使用,但信息工具常常伴随着大量无效信息、结果和结论。虽然它们具有一定的参考价值,但效率有限。而当AI成为辅助工具时,它可以提升工作效率,例如现在的辅助驾驶。仍需人类参与。李想预测,未来AI发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。

理想汽车的VLA(Vision-Language-Action Model,视觉语言行动模型)是实现这一愿景的关键。VLA的实现并非一蹴而就的突变过程,而是一个逐步进化的旅程。目前的L2、L2+组合驾驶辅助仍属于辅助工具阶段,而VLA则旨在让AI真正成为司机,成为交通领域的专业生产工具。

VLA的实现经历了三个阶段,对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段是自研依赖规则算法和高精地图的辅助驾驶,类似于“昆虫动物智能”。第二阶段是端到端+VLM(视觉语言模型)的辅助驾驶,接近“哺乳动物智能”。而第三阶段,即VLA阶段,是一个像人类司机一样工作的司机大模型。

为了解决现有技术的问题并提升用户体验,理想汽车在VLA的研究上不遗余力。VLA的训练过程模拟人类学习驾驶技能的过程,包括预训练、后训练和强化训练三个环节。预训练相当于学习物理世界和交通领域的常识,后训练则注重实际应用中的安全性和舒适性。强化训练则通过RLHF完成安全对齐,使模型遵守交通规则,贴合用户的驾驶习惯。

除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。为确保VLA司机大模型实现职业司机般的安全和舒适,理想汽车在强化训练环节投入了大量资源,并组建了超过100人的超级对齐团队。为了解决模型黑盒问题,理想汽车结合重建和生成两种路径,打造了真实、符合物理世界规律的世界模型。

理想汽车在人工智能时代的成功背后,依赖于扎实的基本功积累。研究是关键,研发的效率会随研究的突破而大幅提升。理想汽车坚持自研,通过技术赋能用户价值。例如,在辅助驾驶方面,由于英伟达Orin-X芯片无法直接运行语言模型,部分企业在端到端+VLM的辅助驾驶方案上面临挑战。但理想汽车依托自有编译团队,自研底层推理引擎,成功使芯片运行VLA。

凭借在芯片、控制器设计和自研汽车操作系统等方面的综合能力,理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。在开源的帮助下,理想汽车在VLA司机大模型的语言能力研发上取得了显著提速。尽管面临挑战,理想汽车仍选择加大投入,专注打造适配多场景的自研模型。李想表示,在受益开源的也要回馈社会。

面对AI的发展,李想强调保留人性的重要性。他认为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。从解决电池成本高、充电难、充电慢的问题,到攻克传统汽车操作系统性能差、开发缓慢、芯片匹配周期长等挑战,理想汽车始终以技术创新解决行业无法解决的问题。在自研VLA时,理想汽车更是踏入了人工智能的无人区。如今,辅助驾驶面临新的转折点,理想汽车将持续挑战成长的极限,为行业和用户创造价值。

  cot和tan的转化