爱游戏官网礼包:
他们让灵巧手远程操控去旋转一支笔,这是全球第一次实现的;还只靠手指动作、不动手腕和手臂,就画出了一个标准圆,这同样是第一次。对比来看,特斯拉 Optimus 的灵巧手有 17 个电机,单只成本超过 6000 美元,而 Daxo 手上的电机数量接近它的四倍,成本却只有 1200 美元。
他经常举莱特兄弟的例子。他们造飞机时,用的不过是自行车店里的零件和链轮,但因为抓住了空气动力学这个真正的核心原理,飞机才能飞起来。张家豪认为,过去几十年里,机器人领域可能也忽略了一条新的原理。Daxo 第一版灵巧手里有上百个电机,用的不是某种革命性的理想材料,而是大多能在 Amazon 上买到的风筝线、烧伤康复袖套等日常物料。他只是把这些重新组织一遍就展现出了惊人的灵巧度。
1996 年,他出生在陕西的一个山区,住在窑洞,是镇上第一个去大城市上中学的学生。后来拿到全奖去新加坡读高中,带领机器人俱乐部比赛,本科在康奈尔大学双修机械工程和计算机科学。他从来不清楚自己的下一步会是什么,但每到一个新的环境,他都会不懈探索,不遗余力。就在不断攀登另一座山的过程中,他慢慢找到了一件自己能全身心投入的事。
线 年 Daxo 创立之初成为首轮投资方,并一路陪伴至今。本次内容来自 Building Deep Tech,以下是真格编译全文。
我叫 Tom Zhang。「张」是我的中文姓氏。「Tom」这一个名字是我读博时起的。我所有的论文和学术发表都署这个英文名,主要是为了方便。
我在中国出生长大,来自中国西北部的一个地方,不是大家常提到的热门城市。如果说「兵马俑」是大家熟悉的坐标,那么再往北,接近内蒙古和蒙古交界的山地,就是我成长的地方。
我们是在今年三月底开始转型的。我们用三个月做出了全球自由度最高的灵巧手。整只手有 108 个电机,每根手指有 20 个,理论上可实现「无限自由度」。
做个对比,特斯拉机器人 Optimus 第三代灵巧手大概有 17 个电机,我们的数量是它的四倍多。我们已做了一些全球首次的 demo,比如远程操控旋转一支笔,这是第一次实现的;还有只靠手指动作、不动手腕和手臂,就能画出一个标准圆,这也是第一次。
我们每次发布一个新 demo,大家都会挺意外的。我们迭代速度也很快,现在已经在做第二代了。我们始终相信,这种新的机器人范式正在真正打开人类生产力的空间。
我生命前 12 年都在山里。我们那里的房子叫「窑洞」,是在山体里挖出一个洞,修整后装上门窗就能住。我在窑洞里住了很多年。说起来很多人都不信,但住起来其实很舒服。
我童年印象最深的就是那种与自然紧紧相连的感觉。窑洞门外通常有个院子,种满了各种庄稼和花。外婆家的院子里有苹果、梨、李子、山楂、樱桃、核桃。我小时候吃的都是新鲜摘的。这就是我最初的 12 年。后来我去西安读中学,那是我第一次去大城市。父母留在老家,我从 12 岁开始寄宿,待了三年。再之后,我因为拿到奖学金去了新加坡。
以前的路是先去延安,再去西安。我那一年刚好有个同学的亲戚在西安当老师,说那里能参加考试。我们班四五个人一起去考,最后只有我考上,还拿了奖学金。
也有同学成绩很好,但因为学费太贵没法去。我算幸运,学校给我减免了大部分费用。原本总共 2.8 万,我只需要付 8000,父母才勉强能承担。刚去的时候,我整个人都跟城市里的同学不一样:我把头剃得几乎光光的,穿着外公外婆做的布鞋,黑布面、白厚底,说话带着家乡口音,别人听了会笑。我当时也没有太放在心上。
我还记得第一次听人说「那双 Nike 鞋要上千块钱」,我震惊了:鞋子怎会是这么贵?
在西安读书那几年,我平时住校,周末会去亲戚或老师家借住。但毕竟每个人都有自己的生活,有自己的孩子,小孩之间有时说话也比较冲。所以我渐渐养成一个习惯:周日提前两小时到学校等开门。学校晚上六点开门,我四点就会到,在校门口附近一个人走来走去。等进到学校的那一刻,我才感觉自己又回到了世界里。我刚去不是班上最好的学生,但我一直很相信自身,总觉得「我可以的」。后来成绩慢慢的变好,到初三时,我已经是全年级前几名。最好一次是年级第二,全校两千多人。
我觉得我在学业上几乎没怎么吃力过。我去西安读初中的时候,身边同学几乎都在上各种补习班。但我没那个条件,也从来没补过课。我就是按部就班地做作业、认真听课。
每一节课对我来说都非常有意思,我会把全部注意力放进去,所以根本不需要额外补习,成绩也一直在往上走。在农村里的生活的前 12 年,爸妈对我要求很严格,但我在学习上从未感到过吃力。
比如一个问题明明有很多变量,答案也可能不同,为什么有人会那么笃定?我经常会想:他们为什么能这样确定?比如有人会说「这个歌手是全世界最棒的」。我就会问:为什么能这样断定?
回头看,每一步里都有偶然、迷茫,还有一点运气。去西安读初中那次,很多家长都在犹豫小孩要不要那么早离家。我爸妈就很干脆,说去吧。后来去新加坡时,我爸妈甚至不知道新加坡在哪里。他们只知道,有奖学金的话我就能去,不然太贵,于是我就去了。连奖学金合同都是我自己看的。再后来,我去康奈尔大学主修机械工程和计算机科学。这中间也有段小插曲。我申请不同学校时,每个学校报的专业都不一样。比如在约翰霍普金斯大学报生物医学工程,在密歇根大学安娜堡分校报环境工程,在范德堡大学报教育和认知科学。我的逻辑很简单:哪个学校哪个专业最强,我就报哪个。
小时候喜欢玩橡皮泥、画画、捏模型。爸妈是医生,家里会有废弃 X 光片,我会把它们折成小车、小船,还会往里面塞电子零件。
去康奈尔后看到他们能做各种很酷的工程建设项目,我就觉得那太符合我了。但老实说,当时也没什么宏大的目标。很多决定都是在走的过程中慢慢显形的。
真正开始清晰是大二、大三以后。那时我才慢慢想到自己真正想投身做的是什么,也开始把能量集中起来。
我会说,探索这件事本身就非常好。虽然那时候我也很迷茫,但我绝不是无所用心。在本科,我是机械工程和计算机双专业,同时对机器人特别感兴趣。我去电子工程实验室设计过 MEMS(微机电系统)和 PCB,也参加无人机团队,设计固定翼飞机的机身和机翼。我修了运筹学、比较文学、密码学,甚至还学了日语和德语。能学的我基本都试了一遍。
到了大三,我开始真的困惑。身边同学要么在实习,要么准备读 PhD,而我在想:
他们没试过别的,怎么就能确定这条路是对的?于是脆休了一年 Gap Year,连续做了三个实习。
我先在麻省的 iRobot 实习,又去了 Rapyuta Robotics,后来在 Uber ATG 实习了整整一年,只是为了搞清楚「工作」到底是什么。
对,那一年确实帮我想明白了很多事,比如我不太想进公司。我在不同阶段的公司都实习过,发现了自己更想有「项目所有权」和「目标感」。所以后来我决定要么创业,要么读 PhD。
当我不知道该做什么时,我就去尝试所有能尝试的。我甚至选过核聚变课程,想搞清楚核聚变或核裂变是不是未来方向。所以我的知识面很杂,跟聚变反应堆工程师聊天也完全聊得来。我的建议是,如果你已经很确定自己想做什么,那当然很好,只要别陷入局部最优;但如果你还不确定,就大胆去探索,没关系。
我很感激父母的教育方式。虽然我妈妈很严格,但在我离家之后,他们其实帮不上学业了,唯一的期待就是我开心、健康。他们从来就没逼过我必须做什么。
而且我本人也比较「直」,不太受外界影响。我知道在康奈尔,大家同辈压力很大,都在找实习、抢 return offer。但我没有被卷进去,我只是想搞清楚自己真正想要什么。我有个朋友说过一句话我特别喜欢:
即使你方向还没想清楚,也不能原地踏步,要去做有强度的探索。那时候我朋友都觉得我疯了——上各种奇怪的课、跑不相同的领域实习。但我真的太好奇了,而且精力也很足。我还去过聚变反应堆实验室研究燃料球。
当你见过这么多东西之后,那种「别人都在干什么」的焦虑就淡了。你会发现,世界太大了,没必要焦虑。
我在康奈尔学得很广、很杂,满足了好奇心,一些课虽然考试成绩还不错,但很多东西其实没有真正吃透。直到读 PhD 后,我又把那些课重新学了一遍。那时候我不再分心四处探索,而是开始专注在一个方向上,才真正把那些知识沉淀下来。
有一次我和我爸在街上遇到一位远房亲戚,他当时说想做一个生意,给我们那里的苹果和梨做一个新品牌。
我爸当场就反驳他:不可能。你连给附近城镇供货的量都不够,怎么做品牌?可那个人非常冷静,他一条条回应我爸的质疑,逻辑很清楚,也很有底气。后来他得了脑癌去世了。但在我三年级的时候,他真的把那个品牌做成了。
我从来不感觉自己是一个典型意义上的学者。我更像是一个被好奇心拽着往前走的人。
是的,他当时说话的方式,那种自信、那种热情,对我震动很大。我可以感觉到那背后蕴含的各种可能性、各种能发生的事。
随着他和我爸的对话继续,我当时的感受是:「为什么还在问?为何需要继续打压他?」但就是那样一次偶然的相遇,我至今还记得那个地点和黄昏的光线。那一幕深深留在我的脑海里。我后来很多次都会想起他。可惜在他去世前,我没机会再和他聊一次。但我想,那可能就是我第一次真正对「创业」产生火花。
我一直都想「造点什么」。我做三段实习就为了确认自己到底适不适合那样的工作环境。
那些公司都很好,团队也好,但一切太稳定、太可预期了,那反而让我焦虑。我只是当时还不清楚自己该如何开始。
后来我去了宾夕法尼亚大学读博。学校在城市里,且沃顿商学院的存在感很强,所以博士第三年时我选了一门创业课。那可能是我认真开始思考创业的起点。一方面,是因为年龄,我开始思考自己要给人生的起步阶段留多少时间;另一方面,这门课本身也很吸引我。很多人说那门课没什么用,说学不到硬技能。但对我来说,那是我在宾大上过最有用的一门课。我几乎和来分享的每位创业者都单独聊过,也经常去老师的 office hour。那门课带来的启发非常大。
我把从对话中学到的东西拿去和朋友分享,也拿去和创业课的导师讨论。越聊越清晰,越聊越兴奋,最后到了一个临界点:我非常确定有一个方向值得投入。
你是与你关系最亲近的五个人的平均值。一个人很难靠自己改变自身。你必须把自己放进一个会推动你成长的环境里,才会真的发生明显的变化。我必须承认市场调查与研究真的很难。一开始我完全不会做,只能按着公司的官方网站上的电话一个个打,绝大多数都会被转到销售部门。有一次对方甚至直接说:「我们在美国不做这种事。」那种被回绝的感觉其实挺难受的,我也确实想过要不要放弃。
我们现在团队有四个人,处于 Pre-Seed 阶段,目前总共融资 135 万美元,不过这笔钱不是用在灵巧手上,而是之前做农业业务时融的。后来我们转型了,现在即将完成种子轮融资。我们正在快速推进下一代产品,这一版会解锁更多物理层面的能力。当然我也同意,距离完全自动化和通用机器人还差很远。
我看到现在很多公司在做的灵巧手,确实很酷,但他们遇到了性能瓶颈。要在一个小关节里塞进微型电机,这种边际成本已经高到离谱。
而我们选择攀另一座山。我们采用的是完全正交的思路,是过去从未有人在机器人学里尝试过的。之所以能在三个月里做出来,就像是我们走上了高速公路,而其他机器人公司还在爬原来的那座山。我经常举莱特兄弟的例子。他们造飞机时,用的是自行车店里的零件和链轮。但他们抓住了空气动力学这个正确的核心原理,所以能飞起来。而我认为,
过去几十年里,机器人领域可能忽视了一条新的原理。我们现在就是基于这条原理,用现成材料造机器人。
比如我们第一版灵巧手里有上百个电机,但成本只有 1200 美元。材料大部分都是在 Amazon 上买的风筝线、烧伤康复袖套之类随手可得的东西。我们把这些组装到一起就能实现那种灵巧度。所以我才在 X 上写:我们找到了另一座山,而那座山的峰顶更美。
在整个人类历史上,唯一一次真正解决「长尾问题」和「最后一公里」的是大模型。
以前翻译、摘要、过滤这些都是分散的,直到大模型把它们整合进一个系统。而在机器人学里,这样的整合还没有发生。
很多人会把这个看成硬件或软件问题。但我们大家都认为,这是一个系统性问题。而要解决长尾问题,方法其实和 LLM 的原理很像。大模型一个关键特征是复杂性。如果我给你一个单层神经网络,你可以写出方程,也能理解;但如果我给你一个万亿参数模型,你依然可以把所有方程写下来,可能要写上几万亿页,可你会发现了自己已没办法真正理解。量变带来了质变。
我们只是将同样的电机单元不断重复,一遍又一遍,就像大模型架构一样。别人想少用电机,我们反而是能多用就多用。结果性能自己就涌现出来了。
当然。和 Daxo 握手的体验真的很特别。如果你哪天路过,提前告诉我,欢迎来办公室体验。也谢谢你邀请我上节目。
