马斯克是我的偶像,非常荣幸有机会与他在这条赛道上同场竞技。
志辉先生说的很清楚,他离开华为创业后想做什么:
对标马斯克,做通用机器人,竞品擎天柱。 不仅面向明星,还抢着商业落地。 最终产品目标价不超过20万元。
用最通俗的话说,他正在研究大型模型与机器人相结合的具身智能。
这个想法始于他的学生时代。
早在2015年,还没成为B站up主的时候,还是学生的智辉老师就参与组织了一群在比赛中认识的朋友,准备“做个人”:
那时,普通人对AI的切身体验还只是人脸识别或者美颜等应用,大模型的概念还没有诞生。 “让机器人拥有像人类一样思考和行动的能力”这个命题似乎离实现有点太远了。 够不着。
因此,毕业后,志辉老师并没有继续只在机器人上折腾,而是选择进入AI赛道,成为一家大厂的AI算法工程师。 他在软件算法领域工作了几年。
直到ChatGPT破土动工,大规模模型智能出现,OpenAI证明大力堆叠确实可以产生质变。
回望自己的机器人梦想,志辉先生再次看到了这条路的可行性。 于是,我离开了聚昌,开始了自己的创业。
于是在半年的时间里,他带领团队拿出了一套看起来不错的原型。
在8月份的发布会上,智慧自己的机器人,被自豪地邀请上台,行走平稳,行走效果堪比去年马斯克首次亮相的擎天柱。
正是凭借这样的作品,他的初创公司致远机器人成为在投资者淡定但市场火爆之际,为数不多获得VC和各大厂商重磅投资的标的之一。
在发布会后与量子比特的会面中,他对发布会、团队以及整体进展表示满意,也表示对未来沿着这条路走下去充满信心。
他还在他的工作站前告诉我们,他的桌面壁纸已经更换很久了:
当他全身心投入做人形机器人生意时,他会如何看待自己公司的高估值? 驰远接下来的计划是什么? 商业化场景会在哪里? 创业后,前100名up主的Bilibili账号该怎么办?
量子比特问,智慧君答,一切都在这场对话中。
如果是后来的话,也许就没有创业的必要了。
志辉先生是第一批感知到这波环境变化并付诸实践的人。
在外界看来,去年年底他宣布创业时,机器人和大型模型是科技领域的热门话题,尤其是ChatGPT刚亮相时,以其暴力美学震惊了所有人。
那时,赛道远没有今天那么拥挤。 技术从业者利用这一趋势并不奇怪。 但志辉先生却首次透露了他当时的心境:
如果选择晚一点,也许就没有必要出来创业做这件事了。
为了解释这句话,他拉出了竞争对手特斯拉擎天柱的时间线:
去年九月展示了原型机。 今年5月,它被展示了识别周围环境、存储记忆和精确控制物体搬运的能力。 7月份,据说已经生产了10辆。 预计11月份进行步行测试,明年在特斯拉自己的工厂投入实际使用。 性别测试。
动作非常快,实际效果惊人。
马斯克这个从不按规矩办事的人,自从宣布进军机器人赛道以来,就以火箭般的速度推进着量产的步伐。 据他介绍,未来机器人的数量将超过人类。
看到这一切,志辉先生感到非常兴奋。 同时,他还观察到了机器人与大型模型相结合的潜力。
微软的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2、VoxPoser、RoboCat等许多作品都在尝试将大型图像语言模型的能力和知识转移到机器人领域。
其中最轰动的Google RT(Robot Transformer)系列在论文讲解和演示视频中展现了在爬行领域出色的泛化能力。
做到这一点并不容易。 核心门槛在于数据。 仅仅为了训练它,谷歌就花了 17 个月的时间,收集了 13 个机器人的 13 万条真实机器人数据——这可能是一个小伎俩,因为 RT 模型是开源的,数据暂时闭源。
志辉君坦言,虽然他从一开始就在准备自己的动作任务数据集,但目前能用来训练自己产品的数据“只有几千个”。
对比之下,巨大的差距是显而易见的。
数字上的直观差距足以解释智辉先生所说的量子比特,“在当前节点,元征A1最需要提升的是数据带来的AI泛化能力。” 这足以解释为什么这“将是一个相对长期的发展”。 布局”。
这也能部分解释直播间网友对于机器人发布时展示时间短、展示能力没有想象中那么酷的质疑。
“我认为,要想达到真正理想的实际效果,我们还需要大量的实景数据。我们的时间太短,在这方面的积累还不够。” 志辉君说道。
竞争对手不会给你喘息的机会。 正因为如此,志辉君表示,团队下一步的重点之一就是建设自己的数据中心。 计划未来几个月登陆临港。 主要目的是搭建场景和仿真平台,填充运动数据,提高泛化能力。
数据是如何生成的? 志辉君得出三个结论:
建设数据中心是工作重点之一,另一个重点是硬件结构的迭代重构,增强机器人本体的运动性能。 据志辉先生介绍,团队将利用敏捷软件开发的速度和效率来迭代硬件。
这是一个非常具有颠覆性和挑战性的事情。
这里说一个小八卦。
今年4月,智慧君提交了一段B站自制双足机器人哪吒的视频,并在视频最后表示,“如果不出意外,哪吒将成为发布会上的彩蛋”。
当然,按照经典剧情,不出意外就会有意外:D、哪吒没有出席发布会。
就这样了↓
量子比特帮大家查出原因是哪吒用的几台电机被供应商摔了。 3月份下的订单直到7月份才收到,导致开发时间不足。
志辉先生说:“以后有时间我会继续完成这个项目,鸽王一定要把任何坑补上。”
半年成独角兽,背后另有商业化暗线
读完本文,你或许会注意到,致远人形机器人项目的机器人本体还需要多次迭代; 而AI能力受限于目前缺乏训练数据,还需要一段时间的积累。
总体来看,该产品距离上市似乎还有一段距离。
然而,这样一个初创项目,半年时间估值就已经超过10亿美元。 这合理吗? ? ?
听到这个问题,志辉先生并没有直接回答值得不值得。 他只是回答说,其实融资想法从一开始就没有敲定。 期间,他参考了很多行业领袖和前辈的建议。
团队最初的想法很简单,就是先做一个demo,然后自然而然地提高估值。
“但创业显然不是一件简单的事情,在经济环境不太繁荣的背景下,整合资源、吸引人才都需要资本的背书。” 智慧君道:“这也不是什么坏事。”
工作高效有效,快速调整思路和策略,以结果为导向推进事情,这就是志辉先生的做事风格。 他的风格最终决定了致远,至少决定了致远研发团队的工作风格。
他亲自为每一位早期技术团队成员加入公司。 这三十人左右,大部分都是自学成才的。 每天睡五六个小时的志辉先生感慨万千:
以前,大家都认为我是时间管理高手,但现在我可以羞愧地说,我们公司里有很多像我一样懒惰的人......
在整个沟通过程中,量子比特注意到他强调了两个关键词,“降低成本”和“应用场景”。
这两个是目前整个赛道的共同痛点。 团队如何解决痛点,必将成为他们获得高瓴资本、鼎晖投资、经纬创投、高榕、蓝驰、BV百度创投等头部投资机构重注的关键。
我们来听听志辉先生的看法——
我们先来说说降低成本。 现在致远的口号是把人形机器人的价格控制在20万元以内。
这和马斯克所说的7万美元价格差不多,而国内同类人形机器人的价格在50万人民币左右。 大家都爱看的波士顿动力地图集价值200万美元。
志辉君直言:“并不是我们希望做到20万元,而是如果达不到20万元的价格,就没有办法实现商业落地。”
至于为何是20万台,他表示,以新能源汽车制造行业为例,如果用20万台机器人取代部分人工岗位,投资回报期可达1至2年。
志辉先生还大致描述了致远在量产时控制成本的方法。
一是尽可能采取自研路线,降低成本,提高效率。
关节电机、灵巧手等部件占硬件成本一半以上,且市场现有供应仍存在功能不匹配的问题。 核心部件自主研发,成本降低一半以上。
二是采用一些类似于特斯拉造车的思路,用软件和算法来补充硬件的精度要求,降低硬件成本。
比如放弃谐波减速机而选择行星减速机、灵巧手上使用的视觉闭环解决方案等等。
下面说一下落地应用场景。 志辉君表示,预计明年下半年商用。 它将首先应用于工业制造领域,家庭等服务应用场景将被移到后面。 这个阶段突出一件事:“场景比较简单,任务比较复杂”。
“这条路线是你一边走一边想出来的,还是你一开始就定下的目标?”
“我们最早在团队不到10人的时候就基本上敲定了这个实施方案。” 他还说:
很多人会把我们或者特斯拉的机器人与波士顿动力进行比较,但这其实是不恰当的。
要实现商业化,正确的逻辑应该是:在满足应用场景功能和性能需求的前提下,以尽可能低的成本实现解决方案。
所以在可以行走和移动东西的场景中,没有必要让它能够后空翻。
如今,半年前定下的航线终于有了明显的落地迹象。
最新工商动态显示,比亚迪已入股致远旗下子公司。 此外,量子比特此前从致远获悉,该公司已与国内领先的智能汽车厂商、3C厂商进行密切洽谈。
因此,在官方宣布之前,人们猜测远征A1在工业制造领域的第一个兼职地点,不出意外就是比亚迪汽车工厂。
除了成本和实施场景这两点之外,随着团队对体现智能理解的加深,致远手中还握有一些其他的差异化牌。
比如量子比特从君智慧的嘴里挖出了一条公司商业化的暗线——
如果说通用人形机器人是商业化的中长期规划和终极愿景,那么在走向这个终点的过程中,团队也会有一些“一路生蛋”的产品形态。
具体形式是什么? 志辉先生一如既往地管得严严实实,保守着秘密,但还是透露了一些东西。
他多次听到有人提问,问为什么要把机器人做成人形。 与其他专门形式(机械臂、轮式)相比,是不是吃力不讨好?
针对这个问题,志辉先生有两个考虑。
一方面,这将是一个长期的投资过程。 不要高估短期价值,也不要低估长期价值。 人形是致远迈向终极形态的第一步,这也是他将这个机器人命名为“远征”的原因。
另一方面,我选择做这件事情(娃娃)并不是因为它容易,而是因为它很难。
通用人形机器人涉及最全面的机器人技术栈。 在其实施过程中,各种前沿技术(视觉伺服自研优化、MPC、SLAM、LLM/VLM、中间件等)一路铺设。 它催生了很多创新型、专业化的机器人产品,“未来大家都会看到一个又一个的成果”。
“网友们可以放心,哔哩哔哩账号不会成为公司专属营销账号。”
过硬的技术,漂亮的简历,大公司的光环,百万粉丝,而且恰逢新技术的爆发周期:大模型、具身智能、AIGC……创业后担任团队CTO并带领公司迅速发展。 半年内,公司人数达到近100人,市值超过10亿美元。
一连串带着光环的故事袭来,围观的人们此时不禁重新审视智慧先生。 现在他会如何定义自己? 量子比特把这个问题问给了智辉君本人。
志辉先生没有表现出任何犹豫,他只是表示,他对自己的定位没有太大改变。
首先是工程师,其次是企业家。
我可能是一个非典型的企业家。 做这些事情的动机是基于个人兴趣。 我也曾幸运地取得过一些小成就:早期在大厂里大放异彩,获得了一些光环,在网上获得了很多成功。 人气爆棚,然后突然跑出去创业。 我周围的每个人一开始都感到震惊。
我一直认为自己是一个乐观主义者。
还有一句话,他毫不犹豫地说——
“既然人生没有后悔的机会,那么我就坚持相信,迄今为止我所迈出的每一步,都是我做出的最正确的选择。”
“每一步都是正确的选择”或许也包括不少人感叹离开华为、挣脱“天才”标签。
在量子比特面前,他毫不掩饰对在华为工作的荣幸的感激之情,还提到:
老东家正在做一些伟大的事情,但对机器人等更多未来领域的探索可能更适合在小型创新团队中完成。
我希望自己能继承“星星散满天”的优良传统。
然后,正如他经常做的那样,他再次强调自己既不是天才,也不是青少年。
可以感觉到,志辉先生希望外界将注意力从某个特定标签转移到他想做的事情上。
有趣的是,他还建议大家不要太早创业。 “对于学生来说,建议先工作几年,接受社会的殴打,才能清楚地了解社会和公司的运作方式,哈哈。”
在当时的发布会上,他也表达了自己的观点:检验一家科技公司价值最有效的方法之一就是看它能否商业化。
否则,技术再好,也容易陷入自我放纵。
谈及此事后,志辉先生表达了自己的想法。 既然他已经开始认真创业了,那么这个项目就不能凭个人的一时兴起、一时兴起了。 招人拿钱之后,你需要更多地思考公司的战略发展方向,“你要对公司这么多兄弟姐妹负责”。
但显然,他有自己值得骄傲的地方:B站。
“个人账号?这几天太忙了(所以没有更新)。” 志辉君解释说,他绝对没有挖坑逃跑的意思。 “等我有空的时候再更新。”
至于后续投稿到B站的作品,依然会保持原来的风格和味道,或许偶尔会夹杂一些创业的日常生活。 但他承诺,不会成为公司纯粹的营销窗口。
(他暗示毕竟致远有独立的公众号,欢迎大家关注~)
“我也在向马斯克学习,他在公司管理运营和个人账户运营之间都做得很好。”
还有一件事
聊到这里,我们怎么能不问鸽王,B站下一次视频更新是什么时候呢?
“今年就确定了,年底前就确定了。”
内容与什么相关?
“它还是一个机器人,我之前挖了一个洞,这是下一个视频。”
好的,经过我的授权,我们替他把这些话放在这里。
咕咕咕咕。
广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 所有 IT House 文章均包含此声明。