卓驭亮相全新一代个性化生成式智驾功能 GenDrive,今年量产落地

IT之家 3 月 19 日消息,卓驭 AI 首席陈晓智昨日在 NVIDIA GTC 2025 发表主题演讲《基于端到端世界模型的生成式智驾体验》,分享了卓驭在端到端智能驾驶技术上的近期进展,并公布了卓驭基于端到端世界模型的全新一代智能驾驶功能 —— 可支持自然语言交互的个性化生成式智驾方案 GenDrive

图片

卓驭认为,好用的高阶智驾,除了足够拟人化,还需要满足用户个性化的驾驶需求。因此,卓驭在行业中首次提出了基于端到端世界模型的“生成式智驾”—— GenDrive 的概念,相对于传统的智驾体验,“生成式智驾”不仅可以给用户带来拟人化的体验,同时也能满足用户个性化的驾驶偏好。

传统的端到端架构,更多是一种基于预测范式的端到端,即观测到一段传感器的输入,预测下一步的动作,因此它是一次性的动作预测的过程。

而 GenDrive 采用生成式的技术来做端到端,通过世界模型来生成未来可能发生的 N 个平行宇宙,再结合用户偏好和各类环境信息来选择最优的轨迹输出。

  • 卓驭的端到端世界模型整体架构,在最底层为硬件平台,包括智驾控制器,可以适用英伟达的计算平台,比如 DRIVE Orin / Thor SoC,并且可适配不同类型的传感器配置。

  • 在模型输入部分,卓驭通过 Vision Encoder 和若干 Tokenizers 来编码传感器数据、导航信息以及历史轨迹的输入。此外,在卓驭端到端世界模型架构中还会将驾驶风格以某种表达编码进模型,以及将用户的语音指令通过文本编码器输入到模型。

  • 对于模型的输出,则包括了周围环境的语义和几何的理解,以及对未来多种可能性的生成。

  • 最后输出的驾驶轨迹,则是与用户风格偏好、语音指令对齐后的结果。

对于端到端世界模型的训练,卓驭采用大模型典型的预训练 + 后训练的方式来进行,并且能够实现“硬件无关”的平台化训练,即针对不同传感器构型、不同芯片类型,只需训练一个模型,就能部署到不同的硬件构型。

基于上述端到端世界模型架构,卓驭的生成式智驾具备以下功能:

  • 自定义场景级别的驾驶风格:比如跟车过程的风格(起步快慢、车距保持的距离等)、速度控制的风格、路口转弯的风格、变道的风格等。

  • 在线学习和模仿用户的驾驶风格:基于用户一段时间的驾驶记录,模型自动学习出用户的驾驶风格偏好,整个学习过程只需用到车端算力,无需任何和云端的交互。同时 GenDrive 也能支持多个用户风格的学习,可以结合座舱内的人脸识别,自动绑定不同的用户 ID,自动激活选择相应的用户风格。

图片

  • 可通过自然语言交互来控制驾驶风格和动作:驾驶风格是指长时的驾驶行为的刻画,比如用户通过语音对话“我容易晕车,能否开慢点”、“不要让其他车加塞我”等,模型可自动识别出用户偏好的柔和或激进的驾驶风格。而驾驶动作指一个具体的、瞬时的行为,比如用户通过语音对话“不要开最左边车道”、“进入辅路”、“靠边停在那辆白车后面”等,模型即可理解用户意图,并实时改变模型的行为轨迹。

图片

IT之家从卓驭官方获悉,这一在行业中首次提出的生成式智驾体验能力,将会在今年内有相关车型进行量产搭载落地

Read More

Meta 公司的 Llama 模型下载量已达10亿次 Meta公司首席执行官马克·扎克伯格周二上午在 Threads 平台上发布简短消息称,该公司的 “开源” 人工智能模型家族 Lla...

Meta 公司的 Llama 模型下载量已达10亿次

Meta公司首席执行官马克·扎克伯格周二上午在 Threads 平台上发布简短消息称,该公司的 “开源” 人工智能模型家族 Llama下载量已达10亿次。这比2024年12月初的6.5亿次下载量有所增长,在大约三个月的时间里增长了约 53%。Llama 为 Meta 的人工智能助手Meta AI提供支持,该助手应用于这家科技巨头Facebook、Instagram 和 WhatsApp等多个平台。这是 Meta 多年来致力于打造广泛 人工智能产品生态系统的一部分。根据专有许可免费提供模型以及微调和定制模型所需的工具。部分开发商对 Llama 许可条款提出异议,认为该条款具有一定商业限制。

—— Techcrunch

Read More

中下 985 软件工程专业,对升学/就业纠结万分,内心很痛苦

Eagle233:

本人上海 985 大一。以下是我的困惑,请求大家的解答,谢谢!

1.长久来看,开发岗和算法(机器学习等)岗究竟哪一个会更吃香?据我了解,开发岗只需要本科,而算法等岗位研究生基本是入场券。我这里的长久来看是考量到开发岗位是否会在可见的未来被人工智能一定程度上取代?是否要为了避免这样的风险选择读研以获得更好的机会? 2.中下 985 研究生的文凭与华五文凭究竟会有怎样的区别?对我来说获取本校保研资格并不困难,但是华五几乎需要学院前百分之十。虽然我第一学期的 GPA 达到了前百分之五,但是我不得不承认这个过程相当痛苦,并且我毫无把握我能继续保持这样的 GPA 。是否放弃保外的想法,仅仅获取推免资格、将时间花在自己更有兴趣的事情上会更有价值?

Read More

甲骨文希望提供安全支持和少量股份以达成TikTok交易

彭博社报道,据熟知内情的人士透露,甲骨文公司正在权衡一项出售TiKTok美国业务的提案,该提案将要求甲骨文公司提供安全保证,并在一家新的美国实体中持有少量股份,同时有可能将该应用具有影响力的算法留在中国方面。

上周,特朗普政府内部流传出一份提案,甲骨文将与美国买家合作,为用户数据安全提供担保。 他们说,这将包括保证更新后的美国版 TikTok 不会包含中国政府可以利用的后门。

根据美国法律,TikTok 的中国所有者字节跳动有限公司(ByteDance Ltd.)必须以保护国家安全为名进行资产剥离,在不到三周的时间内达成协议以避免 TikTok 被禁用,该计划正在酝酿之中。 唐纳德-特朗普(Donald Trump)总统在上任的第一天就发布了一项命令,将禁令执行时间推迟到 4 月 5 日,以便为达成协议争取时间。

甲骨文公司已经与 TikTok 合作保护美国用户数据的安全,这是名为"德克萨斯项目"(Project Texas)的合作伙伴关系的一部分。 上述人士表示,该提议仍是初步的,细节可能会有变化。

任何交易不仅需要获得特朗普的批准,还需要获得 TikTok 母公司和中国政府的批准。 让字节跳动保留算法将更容易赢得该公司和中国政府的支持,但却有可能无法遵守乔-拜登总统去年签署的法律。 这也将使美国对中国可能获取敏感数据或利用该应用进行宣传的担忧悬而未决--ByteDance 和中国政府官员此前都拒绝了这一说法。

一位熟悉此事的人士说,中国政府已经意识到甲骨文可能会提供安全支持并持有少量股份。 该人士说,只要TikTok的算法仍然完全由中国控制,北京当局很可能会接受甲骨文参与的交易。

甲骨文和白宫的发言人没有回应置评请求。 TiKTok拒绝置评,ByteDance的代表也没有回应置评请求。

Read More

Assassin’s Creed Shadows finally showed me the appeal of Ubisoft’s tentpole franchise

Assassin’s Creed Shadows brings the franchise to the shores of Japan. After almost 20 years and 13 mainline games, Assassin’s Creed — the series about using flashy gadgets and techniques to murder your enemies undetected — has finally been set in a place famous for assassins who use flashy gadgets and techniques to murder their […]

Read More

苹果仍在努力将AirPods助听器功能扩展到加拿大

虽然 AirPods 的助听器和听力测试功能已于 12 月获得加拿大卫生部的联邦批准,但这些功能尚未在加拿大上市。 根据 CTV NewsToronto Star 本月的报道,由于各省的法规不同,这些功能尚未在加拿大推出。例如,在加拿大人口最多的安大略省,助听器需要医生或听力学家的处方。

好消息是,苹果公司最近告诉多伦多星报,它正在与加拿大各省合作,争取获准在柜台发布 AirPods 助听器和听力测试功能。 苹果公司告诉该报,它希望尽快推出这些功能,但没有提供时间表。

通过临床级助听器功能,AirPods Pro 2 可以放大周围的声音。 据苹果公司称,该功能适用于有轻度至中度听力损失的成年人。 使用该功能无需支付额外费用。

同时,五分钟的听力测试可以通过测量成年人听到不同频率声音的能力来确定他们是否患有听力损失。 之后,结果将显示听力损失分类和建议的下一步措施。

这两项功能于 10 月底首次在美国和部分其他国家推出,并将继续在更多国家推出。

第三个 AirPods 听力健康功能--听力保护--已在加拿大推出。这三个功能都需要 AirPods Pro 2。

Read More