雷:纯视觉更难做但上限更高开元棋牌Nullmax徐
在自动驾驶中◇▲-▷□,当然可以借鉴VLA★•▪=◆•、VLM这样已有的技术架构和参数▽▽○◇=,用更高的算力实现目标●▲。但如果在中高阶算力•●☆□◆,比如说100Tops左右的车端稠密算力上◆-□•,更好地设计Decoder•◁•=△,它也可以实现和类似大语言结构一样的效果◁…△▽=。Decoder-only的技术架构在纯自动驾驶形态里面是可以被设计出来的□○。
张帆▪☆…:是有可能的▲◆…▪,这是不可避免的△◆。比如前视8Max摄像头是未来城市场景使用的必须配置○…▽▷▷•,不管是30度还是120度的■●▼▲▪,它可以帮助我看得更远…◇○▷■▼、更宽▲☆▲◆。周视和后视可以用2Max或者3Max的▪○◆=, 这些传感器都会有需求量增大的趋势▪○▲★。
在验证过程中◁▪■,我们也能发现更好的Planning Query的设计•◁■◁,尤其是能够把不同驾驶风格的Query融合在设计中=●•,这样就可以处理不同的驾驶行为数据-▪■。这是我们兼容不同人类驾驶习惯数据的使用方法★◁○■。
基本上都是基于Decoder技术架构的设计开元棋牌-□▪,大家目前所做的端到端设计=○□,Planning Query的设计☆□△■●▷。还有Query●▪▲,除了Decoder本身的设计外△•▲△,
现在比较火的VLM+端到端…=☆○■★,或者VLA▷○=•,本质上都是借用了语言的架构设计•…▲◇。从ChatGPT火起来之后▼◁•=▪,语言模型已经过渡到以Decoder-only为主的技术架构设计□■=。
徐雷▪□★▽:海外更多的是法律法规驱动的市场○▼▽,特别是对前向视觉感知的能力要求比较高-▲☆,我们的方案性能表现都很出色▷▽,因此也正在与海外的Tier1共同推进项目合作落地•…▪。
徐雷=●:我们的方案需要能够以快速△□★-、高效•=○-、低成本的方式▽◇△★●•,在车型之间移植…○○。就像手机一样▼=■☆★◆,有一些低端手机●=□◁○,也有一些旗舰手机◁□,我们能够更快速地把方案移植到不同的平台上○☆=○▲■。
即使是实现同样的功能▲▷◆◇-,每家选择用什么样的数据○■▷◆=,怎么训练▽☆,采用什么架构▽▷◆-,如何验证=■●☆◆,还都是非常不一样的■★。
4月23日▽■△▼◁-,首次参加上海车展的Nullmax●◁★,展出了MaxDrive系列辅助驾驶解决方案▷○●◆=▷。
徐雷•★△•:我们是非常支持工信部的规定的•▲=。其实▪◆▪●,在工信部规定出来之前□--,我们所有的宣传就都是以客观事实为基础的▽★,并没有出现「全国都能开◁◆▷○△○、有马路都能开」这类宣传语■▷△-,因为我们现在的组合辅助驾驶技术没有达到这个程度=-。
在车展现场▪•-▪,Nullmax的多位高层参加了访谈环节▷●-,针对行业热门事件=•=◇★动漫IP超级飞侠亮相衡阳开元棋牌这个五一、产品特点等问题给出了自己的观点•…。受访嘉宾包括★○★-▼▼:
Q★★★▼▷◆:全民智驾之下◁◇▼-△★,供应链能不能跟得上…●▽?除了摄像头和芯片••▲,其他的零部件有没有可能出现缺货-△▽?
徐雷★▼…:这有可能是阶段性的挑战◆▽▲,但是以中国的供应链和生产制造能力◇△☆□▪◆,这不是不可逾越的挑战…●○-,我相信供应链跟进的速度会更快○-•。
同时…★•★-,这些感知方案可以适配到不同的算力▲-★△◁,比如说一套平台化架构可以下探到2T算力◇▪◁▷•,向上升级到32T▲•●☆☆•、100T-•=○▷■、200T以及更高算力▲▪△。
既然如此◁▷★◆,在自动驾驶领域是否能够存在自己的Decoder-only的技术架构设计▷△○△-◆?这是我们目前端到端设计的重点▪■▼◆○。
张帆•=○•:每次往上跃级◁○▪=,中国智驾从供应链到下游的算法=-△▷…□,到芯片供应商△△■-,到算法供应商▽▽■-△△,到Tier1都会整体迈上一个台阶▷☆☆◇□,这是必然的趋势△★○。
徐雷▷☆•▲◇=:我们确实不了解特斯拉的技术细节★▪•,但是从公开的技术评测可以看到○◁▲◁●■,特斯拉对中国的法律法规…●-○,也缺少实际道路数据的训练★-△■:有一些在海外是可以压的单黄线◆■◁…•▼、单实线□-◇,在中国法规是不可以的▽•▲△■○。
至少在我们看来■…◇,不同的车企有不同的选择◇△○▪。从实际结果来看▪•■-△★,现在好像选择第三方方案的车企越来越多□▷◇▽●△。
徐雷…◁:智驾是AI在具身智能方面的重要应用场景▷○■▷,我们觉得不管是智驾还是大模型=◇,远远还没有达到殊途同归的方式○◇○★▲▲。
Q△…□•:请预估一下L3在我国真正落地会在什么节点=●▪◁?这个时间节点上★▼▷▷○▪,Nullmax大概在什么位置◁○▲▽▷?
这里面有一个核验证的结论○▷■:在自动驾驶中开元棋牌☆=,如果能够很好地设计Decoder-only的技术架构▽◆,比如将参数量从9000万下降到3000万△△△☆■,也可以同样等价于1B▼○、7B VLM或者是VLA同样的效果◆-…。
另外▪•=▪▲•,我们打造了整套的数据闭环系统▲◁●,包括从数据的采集★●▲◁☆▷、标注•▲▲、训练到部署▲△☆▲▷■、验证到量产的打磨●○▽☆,基础设施的能力也是非常强的○◇。
徐雷•●◇▪:这个问题从我们成立这家公司开始▲◇▪☆,大家就一直在讨论□◇。车企是否要自研▷•,本质上还是取决于不同车企的类型和发展路线▽-…•■开元棋牌多功能磁吸充电器。
Q●▽:今年的百人会论坛上■…▽,出现了很多「车企不要自研」的声音▼◁◇■,我们怎样看待自研和依赖第三方供应商的◁▼△▲△?
成二康-△●▪:这次车展上●▽▪,我们展示了不同芯片算力的域控●▷•◆,包括不同的行车和泊车的场景▽▼□▲□☆。
相较于市面上一些同质化的方案来说-△-…★,我们首先是基于多款芯片打造功能•◇,而且会针对国内外不同的细分市场去打造不同的产品方案▽◁▲…●○,包括了一体机的国产方案和海外方案▷•□◇▪▲,还有行泊一体域控及舱驾一体域控方案▽★。
除此之外▽=▪☆-,平台化的集成方案 MaxOS可以使平台化软件的stack快速移植到不同的芯片上去-●□,快速地为不同的客户服务▽▲◆。
在Nullmax全栈自研的基础上▪=◁,我们视觉感知的实时性非常强…○△○,做到了接近30frame/帧▲•,比激光的10 frame/帧要高很多▷-▷•。
L3高速NOA到来的时间点……,大概是2027年左右…▲▲△▼◁。现在★▼□●▽,L2级的ODD正在逐渐变大□▷●◆,然后经过数据的积累○▲-,我们会把ODD变小★▪▲▪…◁,回到高速●=…★,但是级别会往上走▽•。然后再开始扩大L3的ODD■▼•,往城市里走▼□▲=••。
Q☆••…:DeepSeek的意外火爆■•○…雷:纯视觉更难做但上限更,催生了一种论调▪★◇-◁:在大语言模型领域○◁▲○,算力的需求没有像之前大家预估的那么高△○;那么■▽,在自动驾驶领域•■▼▽▪,对于云端和车端的算力需求是否也有降低的趋势▷••▷=?
但是FSD的一些基础能力…▼★★☆▽,比如说跟其他车的交互博弈的能力◇○•▷▼▲,还是非常强的◁▲•-,这也是为什么我们比较坚定地走以视觉为主的路线◇-○==。这件事情肯定要比激光难很多▷■■▪▽▼,但是最终实现的天花板会更高▷▪▷。
另外…■-,除了一体机市场法律法规驱动以外◆★★•▲○,高速NOA今年在欧洲那边也会有法律法规出来□□○▲,我们基于不同芯片打造的方案也可以落地海外市场•▪●-。
我们现在在做的Planning Query设计•▽…○◇★,可以兼容不同驾驶的风格◇■▷,这样就可以更好地将不同的驾驶习惯及风格设计上去○★▷。
我们有一套平台化的软件技术架构▽…-▷。这套架构具备平台化的感知方案☆△■▪,可以覆盖动态场景识别●▲■、静态场景识别▪▲●•□◇高开元棋牌Nullmax徐,也包含时序场景识别…◇,和更复杂的拓扑识别★★▼◆。
成二康□▷△:其实△▼◁▼▽,除了数据外▼-,架构设计也很重要-□◁◆△■,二者是强相关的□◇◇△■-。我们现在做的数据主要有两种-△▪▼…:一种是实测数据•▲,二是虚拟数据——根据一个轨迹▼▽•,把交通场景重建出来▲○。
我们一直在与合作伙伴◆○、用户讨论系统边界的问题◇▲。提高系统效率■▽•▽,也需要是在安全基础之上=●○,所以我们所有的方案▪◇□▽=,都需要让用户知道这个系统的边界在哪里•☆▲…☆。
有的宣传说某些数据或者人类驾驶数据是没用的=-◆,我觉得这些数据可以倒推到端到端的设计中▪★△。
该方案主打灵活•……◁、普适——它不仅包括了从SAE L2主动安全功能到采用端到端技术架构的城区辅助驾驶系统…=▷△▼-,还能适配国内外主流芯片平台★==、不同类型和数量的传感器◇☆●•▷○,以及各类级别车型•☆-■☆。同时☆•,这些方案还可以满足国内-△▲、国外不同的法律法规▽△•=★•。