风和投资随笔 2514

胡猛先生的投资之道,周一在卡萨机场听最近胡先生在学校的讲座录音时十分有感触,这才是真正通透的投资之道,或者说资金管理之道。正好我们最近的组合也受到了近期市场回调的影响,让我觉得是时刻利用这个回调做些思考和改变的时候了,照例做些摘要。

1 哲学

投资是投资变化,而从完美再往上是最困难的。所以完美企业的投资回报常常只是企业盈利的自然增长,很难有惊喜。多数投资者眼中的完美企业,不是企业完美,而是看起来或回忆起来完美,仅仅是由于投资者眼光的狭隘或者锚定偏见而已。在一个看清了缺陷的企业与想起来完美的企业之间,我当然倾向于前者。

完美是不存在的,这是哲学。不完美,有优点、有缺点才是最常见的。最好是盈利成长+估值成长。

我过去二十六年的投资生涯中,前十四年的思考都是围绕企业、围绕选股。从早期只看价格到后来逐步看盈利、看报表、看团队、看生意……但企业自身的不确定性还是日日困扰着我。通过后十二年的思考我才渐渐意识到:组合更关键。任何一个企业,不论你如何研究,它的明天终究是不确定的。我们是人,我们所有的投资研究都是人对明天的研究,而能掌握明天的只有上帝。所以我喜欢用盲人摸象来形容投资,人类在明天面前只是盲人而已。但是通过组合,特别是有机的组合,投资的不确定性大大减少。所谓有机的组合包括两个层面:横向的结构和纵向的时机。结构指品种的不同权重以及品种间的低相关性和高互补性;时机主要指不同投资阶段的权重和净仓位的变化。时机超越了传统的投资组合的定义,是基于一个四维空间的投资组合理论,这是我这几年的经验总结。

不确定性是这个世界的本质,因为不确定,所以不能去豪赌,豪赌是需要运气的。不依赖运气的话,就需要通过组合来解决问题。

逆短期基本面之势,顺长期基本面之势。华尔街最喜欢的游戏是买进真实盈利比市场一致预期盈利好的企业,卖出真实盈利比市场一致预期盈利差的企业——这些买进卖出常常是我们逆势交易的对手。所以我们喜欢华尔街,他们总会因为一两个季度没有达到贪婪的分析师们的预期就低价抛售一些极有远景的企业。当然,前提的前提是看清一个企业的远景。

顺势和逆势之间,中长期还是要做时间的朋友,短期才可以逆势。

这种确定性、这种大概率都不代表未来,我读历史得出一个结论:主导人类进程的关键事件都是人类自认为的小概率事件。在风和有一个研究的原则:要观测,要推测,不要预测。但即便是我们的观测本身也仍然有很多片面性和局限性。多少投资陷阱就是被“看见”而牵入的。一如既往,权重都从2%开始,不可一步到位。

观测进而判断,而不是预测并等待,才可以及时纠正。小概率事件对投资和人类社会的影响都极大。

投资者,本质上是寄生虫,成功的投资者是寄生在优秀企业身上的寄生虫。他们的成功,依赖于企业的成长。如果没有优秀的企业,就不可能有成功的投资者。

这个说法有点极端,但道理没错,有成功的企业,才有成功的投资者。所以中国人出海这一波,真是我辈之幸运。

投资和经营企业都是在挑战明天,人类关于明天的所有分析、所有判断都是概率或猜测。上帝创造了一个人类无法跨越的四维世界:无穷大的空间和不可逆转的时间。我只是在权重和时间上对一群企业进行“四维”配置,以力求把这群企业的“风险”“和谐”了(这是风和名字的来源之一)。所以,从这个角度来说,我只是一个风险管理者。我的投资理念是:只要把风险管理好了,回报自然就来了。

人类对于未来,长期是不可知的,短期可预期是基于物理的连续性,但很容易被小概率事件打断。所以最大的风险就是小概率事件的冲击,要能管好这个,就是管好风险,剩下的自然就是收益了。

只要你深入企业分析,就是投资;只要你猜市场方向,就是赌博。投资也会常常面对小概率事件,但持之以恒,时间就是你的朋友;赌博偶尔可以求富贵,但时间不是你的朋友。

投资是分析的结果,赌博是猜测的行为。

2. 方法

一个显著标志就是单一投资的最高权重从过去在中国的100%到创建风和亚洲时为自己设定的6%。100%意味着当我对一个企业的未来高度“确定”时我可以把所有的资本投入进去。100%到6%,这是怎么样的一个投资旅程!总有同事挑战我6%的限制,我开玩笑说,如果上帝给我推荐一个股票,我可以配置100%,因为他是时间的主宰(我在中国进行100%的配置时一定是狂妄地把自己当成了市场的主宰)。

个股6%的仓位限制,背后是对不确定性的最大稀释。

在风和,决定权重的绝不是同行所推崇的上行空间,而是我坚持多年的对下行空间和亏损可能性的评估。基于上行空间进行权重配置只是赌博而已。

我们保持一个动态的权重管理。这是我们周期哲学的完美体现。在亚洲,多数企业的发展都不是一帆风顺的,而是起起落落。所以研究它们起落的周期模式非常重要。虽然横跨6个市场,但我们跟踪的企业只有200个,一个原因是我们对亚洲公司治理的谨慎,如果四处寻找机会很容易踩到地雷;另一个关键原因是我们通过长期跟踪来发现和把握目标企业的发展周期。在周期的研究中,我们又把周期分为短周期、中周期、长周期。中周期是我们选股的关键,短周期是我们权重管理的基础。短周期的因子包括估值、市场情绪、库存等等。我们依据短周期来进行逆势的权重调整。比如,估值高的时候1~2%;估值低的时候4~6%。情绪高的时候减权重;情绪低的时候加权重。

决定权重的不是上行空间,而是下行风险。短周期可以直接根据情绪和估值来调整权重,情绪和估值往往也是一起的,短期要逆势,中期靠选股,长期还是要顺势。

我的组合永远追求的是单一品种必须能独立地盈利,虽然可能从结果上看形成了对冲,但出发点不是。关于动机与结果的关系是一个永恒的哲学话题。比如投机与投资,你如果为了投机而投机,通常会失败,但你带着认真的投资心态去研究、去判断,投机就更容易成功。演员为演戏而演戏是演不好的,但你去体验生活并投入角色,就可以成为好演员。

独立双向选股,空头就是自然对冲,追求对每笔交易的绝对收益。用投资的心态去投机。

投资流程是自己给自己设定纪律,最大程度地降低自我情绪的影响,把投资决策变长变慢,追求慢投资。慢投资有时会错失一些机会,但是我的经验清晰地告诉自己:错失股票不是错,买错股票才是错。我的投资流程中的LOGOS只是一些常识性问题的checklist,但是这个checklist可以训练同仁们的全面思考与系统思考能力,是个协助同仁们寻找盲点的checklist。

慢投资是个很好的方法,可以降低情绪和市场波动。最大的风险不是错过收益,而是造成了损失。这也是我最近的教训所在,快速建仓有好处,但需要分析情况。

风和的风格是“多中”:做多一些中型企业——我们能看见确定的变化的中型企业,这些变化有周期的变化和结构的变化。我们笃信投资这些中型企业更能创造阿尔法,这主要基于这些变化的边际效应和确定性。比如我们重仓的金斯瑞,只要Cart-T成功,企业就会发生翻天覆地的变化。中型企业还有一个特质:我们研究的勤奋程度可以产生区别,可以让我们比同行看得更清晰。

而做空则是“空大”:做空一些我们看见向下变化的恐龙级企业,这些变化也包括周期性变化和结构性变化。

多中,是买入中型企业带来的确定性变化;空大,是要在倒下的大象上菜踩烂,两个都有用。

中国市场总体上是崇尚集中的市场,我曾经也是崇尚集中的投资者,40岁以前,我管理的组合,不论是机构的组合还是我个人的组合,都没有超过10个股票。但在知天命的今天,我所管理的组合已经超过了50个股票。其实我今天管理的组合和二十年前比,AUM相当,但二十年前我管理的组合只有3个股票。

集中的组合更容易被运气左右。任何一个股票的分析和投资都充满了假设:显然的和隐含的,也包含了一系列大概率的选择。但有时候有些显然的假设不成立了,有时候发生了小概率事件,你的这个投资就可能发生亏损。集中的组合可能出现多数股票都发生小概率事件,也可能发生持续歪打正着的好运气。但一个高度分散的组合是不太可能同时出现多数股票发生小概率事件的,也不可能有如此多的歪打正着。分散的组合更能体现投资哲学、投资框架、投资流程、投资纪律的价值。几个股票凭灵感、凭几个关键信息或关键逻辑就可以取得成功,但50个股票不可能。

我认为集中的组合需要“天时、地利、人和”,而分散的组合更需要“人和”。分散的组合对团队选股的能力要求更高,平庸的团队的分散组合一定跑不过市场。越分散,其表现越依赖于投资哲学、投资流程以及相应的投资一致性,也更能体现投资团队的能力。

集中对运气的依赖更大,分散才真正体现投资实力,所以要从集中到分散。我们正在这条路上而已。

3. 投资

创立风和之初,我就把价值分析分解为了5个M:目标市场(M1)、市场份额(M2)、利润率(M3)、商业模式(M4)、管理团队(M5),这是围绕ROE建立起来的价值分析框架。因为我所理解的公司核心价值就是ROE,即为股东创造利润的能力。M2、M3、M5将会是我们未来做多的重要角度。而M1、M4的研究则有助于我们发掘大量空头机会

5M还真是企业价值的关键所在,团队和模式之外,剩下的就是市场、份额和利润率了,简单而有效。产品、竞争力和壁垒最终都会体现于此。

这在风和的5M分析框架下很容易被理解,就是M1(目标市场)外延的扩张解决了M2(市场份额)天花板的困境,从而进一步推高了M3(营运利润率)。市场份额和利润率在上升的股票是个多头品种,而且以其15%ROE、1倍PB的估值,是一个可以重仓的多头品种。

最好的成长概念,市场扩张、利润上升,说明企业竞争力很好,如果估值低,就是很好的投资品种了。

我的5M3T框架是完美的做空框架。M1(Addressable Market)和M3(OP Magrin)的波动带来的做空机会,我定义为“周期性”做空,这里的周期指行业的周期。M2(market share)的波动带来的做空机会,我称为“结构性”做空。这背后有M4(商业模式)或M5(团队)的原因。虽然也表现为企业自身的产品周期或库存周期等,并会带来M3的波动,但它是企业自身的问题。其重要特征就是同行业其他公司仍然表现优异,目标公司却表现糟糕。简言之,周期性做空是做空行业,结构性做空是做空个股。

做空行业是周期性的,做空个股是结构性的。行业的做空主要是周期性收益下跌,个股的做空则主要是产品或竞争力的崩塌导致市场份额急剧缩小。最近的外卖大战就是典型。

投资框架就是我的3D5M3T。3D是研究股价驱动力量:D1是ROE,是公司价值的内延成长。D2是价值的外延变化,分为结构变化和周期变化,通过5M框架来分析。D1和D2都是人的驱动,D1相当于匀速跑,D2相当于变速跑。D3是情绪或估值的驱动,或者说是狗的驱动。3T则是时间框架,既协助理解D2的变化,也协助理解D3的变化。人是活在时间里的动物,把时间框架搞清楚了,对情绪的变化就容易理解了。

驱动股价的3个动力之源:ROE、周期和估值。放到3T的三个事件维度中,短期T1,3个月以内;中期T2,3-15个月的1年;长期15个月以上。

风和的3C投资哲学中,第一个C就是周期,要学会在周期面前的谦卑而不是高估人类基于惯性、偏见的成长“确信”。这是我经常提醒我自己和团队的。风和3C哲学中的一个C就是变化,投资是投资变化,是以好价钱买进变好的企业,而不是简单买好企业。好企业常常估值贵,而且从好到更好不容。3C投资哲学中最重要的一个C就是确定性。我经常讲,天上掉下很多馅饼,但我只接站在地上伸手可及的馅饼。

这也是投资的重点所在,周期、变化和确定性。

这就是我投资的精髓:要超越华尔街投资者的线性思维,超越华尔街的模型。通常的模型只能吸收一些确定的可以量化的变量,而伟大的投资者一定要善于发现那些模糊但确定的东西,并发现变量背后深层而关键的逻辑,也就是我经常讲的keydriver。

当我们以成长的角度看待未来,总是处于焦虑之中;当我们以周期的角度看待未来,突然觉得世界海阔天空。

这正是当前AI泡沫论中焦虑的根源所在,期待成长、期待更快的成长,总会焦虑。但从周期看,已经明显偏高的,远离即可。价格适中的,可以进入。

我告诉我的团队,投资很简单,无非就是“搜集信息+思考加工”,最后基于大概率得出投资结论。我们坐在新加坡投资中国市场,信息不是我们的优势,我们只有靠思考胜出。思考是拼智力,就是要比其他投资者聪明。更聪明很重要但不容易,因为这是短期内很难实现的。但是有一条捷径,不用更聪明,只需要不一样的思考维度、不一样的思考方式。

更好的思维模式、更接近本质的思维模式才能带来真正的大变化。

那我说的价值是什么?就是企业的现金+可变现的资产+创造未来现金的能力(硬核ROE)。什么叫硬核ROE?就是你赚的是现金,不是应收款,也不是左手进右手必须出的资本开支。而且必须是可持续的自由现金流,今年赚了明年亏损的也不算。

真正的DCF。

从100块做空跌到30块,赚70%;从30块做空跌到10块,仍然还有66%可以赚,这就是做空的魔力。当然,前面70%由于潮水未退,大家都在猜谁没穿裤子,是高难度的,后面70%的确定性要强很多。这种策略在风和内部的代号是“踩烂”。由于做空敏感,我就不再列举具体的公司名字。但是可以给大家启发,多数是大象级别的企业,倒下去就爬不起来。

所谓周期,就是M3做空,企业产品不会被淘汰,生意依旧在,但是由于行业供需原因,利润率受损。这种做空可以逆势投资,在margin创新高时如果预见到供需的变化,可以伺机而short。周期做空需要清晰地了解其长期价值中枢,在周期底部必须清晰了解重置成本。这些公司过几年又是好汉一条,踩烂要谨慎。周期的优点是确定性强,管理层无能为力,而且是整个行业都可以short。

如果一个公司T1已经出现问题,股价已经下跌一定幅度,但T2和T3(15个月以上)还是有很大问题,我称之为“踩烂式”做空。这是一种顺势做空,回头看图,是腰部做空或者C浪做空,做空的是盈利。

回顾我们过去在科技、澳门赌场、航空机场、金融等领域的成功做空,都是周期性做空。有的起因是结构性思考,但成功是因为周期,是结构+周期的成功。而且,思考的主轴应该放在周期,在确定了行业的下行周期后,在行业里选股时可以有结构性的思考。结构性的做空是可遇不可求的。

风和团队不论牛市、熊市,长期坚持做空的秘诀就是坚持自下而上做空:做空企业市场份额丢失或者利润率下滑,也可表述为M2做空(M2指市场份额)和M3做空(M3指利润率)。

做空的艺术。

大多数对冲基金的失败是败在回撤管理。当回撤发生后,由于急于挽回,通常有两个应对方式:1.更重仓于一些自认为高确定性的品种;2.积极判断市场,进行更大的单边做多或做空。这两种方式几乎是人类的本能反应,其共同点是:更加不平衡,增加了风险暴露。

风和亚洲在回撤管理这个方面是对冲基金中的佼佼者,成立以来所有的回撤都以V形反转。风和是怎么应对的呢?1.拒绝判断市场,以中性的策略更严谨地挖掘阿尔法;2.更分散,头寸更平均。风和并非永远不判断市场,但我们预判市场并相应做有倾向的配置都是在基金当年回报可观的情形下。

回撤管理也是个关键,不能盲目加减仓,有可能带来收益,也可能带来灾难性的损失。

4 其他

我们的组合通常拥有50~70个股票,有12个分析师在跟踪这些股票,平均每个分析师只跟踪5~6个股票。而且风和与绝大多数基金不同,没有全体例会,每位分析师独立研究,和我进行一对一的对话,以确保他们的思考与分析的低相关性。

独立研究、独立对话、有限跟踪,是个很好的方法。

我的研究分三个维度:过去所有投资的命中率;错误投资品种的亏损率;正确投资品种的盈利率。所以我的盈利来源很清晰,每年100个交易:65×2%(盈利品种平均权重)×20%(盈利品种平均回报)-35×1.5%(亏损品种平均权重)×13%(亏损品种平均亏损)=20%。

清晰的收益来源,命中率、平均收益、平均亏损。

以ROE定义,通常10%以上的ROE,有20%以上相对合理估值的低估我们就可以考虑买入。这和巴菲特寻找25%以上ROE的公司的高要求不同。这和我的“不和股票结婚”哲学相通。

ROE的低要求带来了更多的投资机会。

我们更强调投资现在,而不是未来。投资未来是我们VC团队在做的,在股票市场我更追求投资一些能看得见的回报。指导我们投资的是ROE和PB。对估值,我非常保守,只要高估,我就开始退出。所以我们过去八年几乎没能从互联网公司以及消费品公司赚到钱。我们最赚钱的领域是科技硬件和金融,通常都是10~20倍PE、1~2倍PB的公司。

低估值+成长和确定性回报带来的收益。

有很多伟大的投资者如巴菲特是不喜欢做空的,但我想这背后的区别是国家与投资者性格的不同。美国是在科技不断进步的推动下让经济一浪一浪地上升,所以买进并持有是可以创造伟大回报的,而亚洲的经济则是随着产业转移推动下带来的周期起起落落,多数企业的盈利都是大起大落的,如果简单买进持有而忽略周期的变化,最后只能是竹篮打水一场空。至于我性格中对周期和风险的敏感,其实也是这种周期环境影响的结果。如果我成长在美国,可能也是个非常乐观的长期持有者。

无疑。多平稳的地方才可以长期持有,动不动就90%回撤的国家没办法长期持有,需要周期性持有,但也不是坏事。

发布在Book | 发表评论

黄仁勋:英伟达之芯 2513

第一次出现需要重写的事情,昨天上午写完后一发布居然就全部丢失了,完全不知道为什么。但或许也是好事,可能是某种声音暗示我这本书的重要性超越了其他,也确实非常重要。这是前天飞卡萨布兰卡的飞机上读完的,当时的第一感受是后悔没早点读,否则能更好理解当下的AI了;第二感受是英伟达这样的投资机会,真是什么时间投资都不晚,在上一波AI浪潮中就应该关注,特别是对与计算范式的改变,真不应该无动于衷。当然现在晚了吗?也是个新问题。照例做些摘要,这次还专门简单归类下,打破原来的顺序。

1. 品格

黄仁勋表示,自己有过很多挫折与痛苦的机会;直到今天,他仍经常在英伟达内部使用痛苦和磨难这两个字,但是是以“欢乐的方式”。黄仁勋认为,性格不是靠聪明绝顶的人塑造出来的,而必须是经过磨难的人。我希望各位有机会经历大量的痛苦和磨难。我最大的优点之一就是我的期望很低。对自己期望非常高的人,往往韧性也低,不幸的是,韧性对带来成功至关重要。所以如果我可以给你建议的话,我希望各位有机会经历大量的痛苦和磨难。如果你追求的是伟大,你就要完善、培养公司的企业性格。

痛苦+磨难使人成长,降低期望,拥有最高的韧性,不断迭代、成长。

可为什么这个人不仅创立了这家了不起的公司,还在身边建立起了一个愿意为他赴汤蹈火的人际网络?”霍斯特曼觉得,黄仁勋一直在不断地改变自我。他回忆起在LSI时的黄仁勋,总是能把模拟软件用到极致。霍斯特曼说:“现在,他依然在这样做,只不过他正在‘工程化’的是自己。他并非生来就是一位伟大的CEO,也并非注定会成为这样的人。他通过不断的抽象思考,通过解决一个好CEO应该具备的输入和输出问题,把自己变成了这样一个人。”但说到底,还是张忠谋的看法最具分量。他并不认为黄仁勋之所以能成功,是因为他的工作伦理——在台积电,这只能算是略高于平均水平,他也没发现黄仁勋有什么特别的适应能力。在他看来,一切的成功都并非难以捉摸,而是有迹可循的:“他们的智慧确实超乎常人。

工程化行为的机制,思维容易,实践难。加上智慧超人的神来之笔,就好比智慧是慢思考部分的顶级逻辑推理,而工程化就是快思维部分的长期迭代,最好的组合,两个最好模型的持续提升。

黄仁勋之所以能在并行计算、人工智能、Omniverse等他人失败的领域取得成功,源于他不容忍对未来进行毫无根据的臆测。他总能冷静地从第一性原理出发去审视技术,既不受乐观情绪影响,也不被恐惧所左右,仅凭一种冷静且耐心的商业逻辑,将企业远见推至极限。对除此之外的一切,他既不看也不去想象。人类灭绝的可能性并不属于企业战略层面的问题,对他来说,这纯属无稽之谈。

持续第一性原理的使用,既不乐观也不恐惧,才能持续专注和提升。

2. 创业、管理和战略

他深知创业之艰难,硬件类初创公司更甚,而面向消费者的硬件初创公司则是难上加难。多数公司连原型阶段都达不到,更别说其他了。对黄仁勋而言,做出决策需要冷静分析,容不得憧憬等无用的情感因素的干扰。对他而言,商业不过是另一个工程问题。工程师们试图将复杂问题简化为基本原则,进而利用这些原则产生强大的效果。若要创办初创公司,黄仁勋的首要任务是掌握这些原则。他需要深入研究市场、供应链、竞争态势、技术及产品匹配度。此外,他不得不与客户、游戏开发商及计算机图形专家进行探讨性的电话沟通,研读枯燥的行业报告,翻阅柱状图、销售数据及客户调查,以探寻行业上升趋势。简而言之,他必须做好周全的准备工作,而这些准备工作只能在一个地方完成。

黄老板创业的第一天居然就如此严谨,天生的成大事体质了。商业是个工程问题,方向对了的话确实如此。

黄仁勋设定了一个关键数字:5 000万美元。他认为,自己的初创公司年收入至少要达到这个数,所有的努力才值得。他在笔记本电脑上做了一个电子表格,预测未来几年的收入。每当调整表格中的某个变量时,预测的收入就会在5 000万美元上下浮动。

5000万就是黄老板工程化的第一个参数和里程碑了。这样的目标设定认真、很有意义。

然而,那些将PC端游戏市场拱手让给英伟达的工作站公司,却犯下了一个致命的错误,这与几十年前通用汽车忽视本田的失误如出一辙。英伟达向本田学习,向青少年消费者销售低利润产品——如果这一类比成立,未来英伟达有可能会超越太阳微系统公司和硅图公司的商业工作站。有时,黄仁勋甚至会在他召集的高管团队会议上,谈论颠覆英特尔的可能性,要知道,当时的英特尔可是全球最具价值的公司之一。与此同时,英伟达在英特尔的势力范围内,通过持续的策略性撤退以求生存。“直到今天,我们都不与英特尔正面竞争,”黄仁勋在2023年描述双方这种猫捉老鼠的关系时说道,“每当他们逼近我们时,我就会迅速撤退。”克里斯坦森的建议为英伟达指明了方向,那就是销售英特尔想不到要去生产的小众产品,给英特尔永远不愿服务的客户。“黄仁勋很早就跟我们说过,英伟达有朝一日会超越英特尔。

创业者窘境的另一个经典案例了。从小众市场跑出第二曲线,然后成长为新的巨头,淘汰掉过去的一切,改朝换代。

在激励舒奎斯特的过程中,黄仁勋采用了一种名为“光速”的调度策略。他满怀热情地将这一管理理念灌输给每一位员工。在英伟达,几乎每位与我交谈过的人都至少提及过一次“光速”。“光速”这个词,并不像大家普遍认为的那样,只是单纯指速度快。黄仁勋所倡导的“光速”,是希望经理们能够设想到,在没有任何限制、一切条件都最理想的情况下,某项任务能够完成的最快速度。比如说,如果我们要以“光速”从纽约飞到伦敦,那就意味着天气状况绝佳、没有交通拥堵,而且乘坐的是超音速飞机。有了这个理想化的速度作为参照,经理们就可以根据实际情况,制定出一个既切实可行又能让人眼前一亮的交付时间表。舒奎斯特跟我说:“这个方法听起来好像很难,但实际上,它真的能帮你减轻不少压力。

光速其实是基于第一性原理的极限推理。知道极限,才能更好规划当下。

3. 第一性原理

起初,黄仁勋对此表示怀疑。这种被称为“并行计算”的方法,之前已有超级计算机供应商尝试过。“硅谷遍布并行计算平台公司失败的例子,”他说,“除了我们,没有别家并行计算公司被创立过——没有,一家也没有。”(他有时说话会稍显夸张。)但之后,黄仁勋开始从第一性原理进行推理。他猜测卡马克不会满足于仅有两个独立的像素管线。随着射击游戏日益复杂,他总会想要更多。想象一下,一个场景中有很多光源:灯光璀璨的竞技场、多把枪支同时开火、远处一艘宇宙飞船坠毁,还有一个双太阳照耀的世界。如果3dfx为每个光源都专门设计一块芯片,最终电路板上将满满当当。满足卡马克未来需求的唯一方法,就是在单块硅芯片上增加管线。”“不过,在做出决定之前,黄仁勋必须做好万全的准备。他得了解,这种方法过去为何屡试屡败。

在CPU的串行方式走到摩尔定律极限的时候,并行计算带来了新的范式革命:GPU+CPU,提供了更好的解决方案,这就是今天的NV 72系统。有一个,还会想要更多,体验更好,就是这个第一性的基础。

尼科尔斯察觉到业内对此问题持否认态度,尤其是英特尔公司,他们自信地预测,缩小晶体管的尺寸就能实现性能的线性提升,直到其元件缩小到仅一个原子宽。尼科尔斯却认为这不可能实现,于是在2003年初,他主动给黄仁勋写了一封信,阐述了他的观点。在信中,尼科尔斯对现在的局面没有感到惊慌失措,也没有夸大其词。相反,他凭借精确而适度的紧迫感,运用电学原理,解释了为何英特尔在半导体行业的长期霸主地位即将终结。黄仁勋表示:“我们之前已经预见到了这种趋势,但正是尼科尔斯让我确信摩尔定律真的已经走到尽头。他为公司今天的辉煌成就做出了巨大贡献。

尼科尔斯20年前就看到了摩尔定律的终结,之后进入英伟达,英伟达的创新不是摩尔定律的延续,而是超越,所以带来真正革命性的不是晶体管数量,而是并行计算+CUDA。这也是去理解去竞争力的核心。

cuDNN是一个专为加速CUDA平台神经网络开发而设计的软件库。卡坦扎罗决定越过层级,直接向黄仁勋陈述自己的观点。“出乎卡坦扎罗意料的是,黄仁勋对他的理念产生了浓厚的兴趣。在二人的首次会面之后,黄仁勋甚至推掉了所有安排,整整一个周末都埋头钻研人工智能这一他之前几乎未曾涉猎的领域。而在随后的会面中,卡坦扎罗惊讶地发现,他的上司对神经网络的理解已然与他旗鼓相当,甚至可能更为深入。黄仁勋的CUDA决策如同一场豪赌,使公司踏入了深邃莫测的未知领域。10年来,他始终站在船头,远望彼岸。如今,仿佛他已寻得传说中的亚特兰蒂斯。他全心投入研究与电话会议中,每多了解一分,他的兴奋便增添一分。至2013年中,已经按捺不住内心强烈的共鸣。他将卡坦扎罗召至自己用来办公的会议室,告知他,自己视cuDNN为公司20年历程中最为重要的项目。

黄仁勋告诉我,他只是基于第一性原则进行推导。“既然它们能解决完全无结构的计算机视觉问题,那就引出了一个问题:‘还有什么可以教给它们?’”黄仁勋说道。答案似乎就是:所有事物。黄仁勋断定,神经网络将彻底变革社会,而他可以通过CUDA占据必要的硬件市场。他宣告,自己将举公司之力投入这个项目的发展。“他在周五晚间发了封电子邮件,说我们将全面转向深度学习,不再只是一家图形芯片公司,”英伟达副总裁格雷格·埃斯特斯(Greg Estes)讲述道,“到了周一早上,我们已经转型为一家AI芯片公司。真的,转变就这么快。”“就在几个月前,黄仁勋刚满50岁。“2014年初,cuDNN即将面世。在2014年的GTC大会上,黄仁勋登台推介此项成果,这是英伟达21年历程中首次公开与AI的联合。

从视觉推向万物,就是神经网络从图片,走向语言,走向AGI的关键推理。NV也发现了真正的大机会。

在OpenAI组建团队之际,黄仁勋开始为他们量身打造一台计算机,DGX-1。研发过程是从最基础的原子层面开始的。台积电当时提供了一种名为鳍式场效应晶体管(FinFET)的制造技术,其中的晶体管就像鲨鱼鳍一样从硅基底上凸起。如果你能缩小到站在硅的光滑表面上,那些鳍状的晶体管会看起来像板式公寓楼一样,在每个方向上高耸200个原子。这些晶体结构与其说是“印刷”出来的,不如说是用紫外线光以极高的精度雕刻而成,这种精度足以让文艺复兴时期的大师们叹为观止。工程师们形容这一制造过程,就好比从月球表面发射激光,要精确击中阿肯色州人行道上的一枚硬币一样。英伟达的首款FinFET芯片架构被命名为帕斯卡,以致敬17世纪的哲学家兼数学家布莱兹·帕斯卡,他发明了首台机械计算器,这是他众多成就之一。这一命名蕴含着对计算领域主要瓶颈的隐喻,长久以来,计算速度都是难以突破的桎梏。从帕斯卡的齿轮驱动加法机,到ENIAC的真空管,再到英特尔和IBM的微型芯片,计算机在执行算术运算时始终未能达到理想速度。然而,英伟达于2016年4月发布的P100,其计算速度竟超越了数据向机器的传输速度。凭借这些芯片,计算速度不再是核心难题。“计算机”已超越了单纯的“计算”行为。

DGX-1的成功也有相当的偶然性和巧合,如果不是恰巧碰上TSM升级FinFET,可能也没有今天的NVDA了。P100还因此能加载更高的电压,带来更快的速度,以及及早发现传输InfiniBand的重要性。

机械进化会……会毁掉工作机会吗?”黄仁勋越来越气愤,声音也不由自主地提高。“难道计算器的出现就毁灭了数学吗?这种问题真是老掉牙了,我听得耳朵都生茧了,”他抱怨道,“我不想再谈这个话题了!同样的问题,反复讨论,没完没了。想想看,我们发明了农业,让生产食物的边际成本几乎归零,这对社会难道不是好事吗?我们大规模生产电力,使砍伐树木、生火、携带火把的成本几乎为零,然后我们就可以腾出手去做更多其他的事情了。紧接着,我们会去降低计算的边际成本——长除法!我们将其降至零!”他的嗓门开始提高:“我们一直在努力将各种事物的边际成本降为零,一代一代又一代,而这样的争论每次都会上演!

虽然是愤怒的回答,但依然能直指问题的核心:算力的边际成本为零后的未来,一定是更广泛的使用,带来更大的革命性变化,并因此创造一个更好的未来。

4. AI与洞见

邱教授选择使用游戏显卡来组建自己的计算机,这恰恰代表了英伟达的典型客户。通过发布支持CUDA的零售显卡,英伟达正将产品推向那些即便是最不起眼的科学家——他们通常怀揣热情,却由于研究领域的冷门而负担不起昂贵的工作站。在这一方面,黄仁勋再次践行了克里斯坦森的理念。克里斯坦森观察到,颠覆性技术往往源自业余爱好者的社群。这些技术利用“盗版资源”得以开发,其中“现成组件”被重新赋予新的用途。起初它们可能表现不稳定,但在那些被主流玩家所忽视的性能方面,能迅速取得进展。

爱好者标签带来的颠覆性,难得是黄老板能够如此敏锐的关注到,还清楚意识到其重要性。

当辛顿的同事研发出一种能够超越最先进的行人识别软件的神经网络时,他甚至连让论文被会议接纳的机会都没有。“人们的反应是,这不算数,因为它没有解释计算是如何完成的——它根本没有给我们带来任何新的洞见。”辛顿说道。辛顿曾反驳说,没有人能够理解如何用数学语言来描述生物大脑处理语言的方式,但这个论点并未能为他赢得更多的支持。当时的人工智能界并不满足于仅仅模仿智能——他们渴望的是破解它。辛顿认为,试图去破解大脑的功能显得有些荒谬,就好比试图去解析肾脏的功能,然而,这样的观点并未能为他争取到更多认同。为了掩盖他的工作内容以便更顺利地获取资金支持,他与其他神经网络研究者共同选择将他们的研究描述为“机器学习”,有时也称作“深度学习”,却唯独避免提及“人工智能”一词。

像大脑一样搞不懂,但能输出好结果,可能就重要了。基本原理搞清楚至少不是工程学问题。

茨克弗难掩兴奋之情:GPU的速度简直前所未有,比他以往所见的任何技术都要快上数百倍。从苏茨克弗首次接触神经网络起,他就深信其具有巨大潜力。在他看来,用神经网络进行计算机智能运作似乎是理所当然的方式。“倘若你愿意相信人工神经元与生物神经元有些许相似之处,那么它们理应能够完成我们所能做的一切,”苏茨克弗对我说道,“如果你愿意相信它们可以更进一步,那么你实际上就是在训练一个大脑。”过去,这种方法总是受到硬件的限制,然而如今,GPU在半分钟内就能完成英特尔机器需要1个小时才能完成的任务,而同样的任务,生物学上则需要耗费10万年的时间。

颠覆性的时刻,半分钟 vs 1小时,已经是2个数量级的提升了。

云服务提供商以“每小时每个GPU几美元”的价格进行报价,而新款英伟达芯片组的费用接近3美元。(相比之下,访问类似的英特尔CPU仅需几美分。)以这样的速度,训练类似AlexNet的昆虫大脑大约需要500美元,但研究人员正在开发更为雄心勃勃的模型,这些模型拥有数十亿个参数,训练成本高达数百万美元。尽管训练成本高昂,但如果操作得当,它可以实现自我回报,正如谷歌努力展示的那样:通过利用神经网络优化其服务器网络的能耗,谷歌每年在电费上节省了数亿美元,几乎立即收回了其在AI上的投资成本。谷歌还为其照片应用推出了图像识别工具,为用户图片创建自动标签,并利用AI提高了搜索结果的质量。

最初的AI芯片投资,收回投资很快。这个领域也是黄仁勋多次提到的现有数据中心升级为AI数据中心的改造机会,会有很好的回报率,而不是亏钱。

黄仁勋敏锐地发现,租赁虚拟计算设备比销售实体硬件更具盈利潜力。于是,在2017年,他推出了两个租赁平台。首先是GeForce Now,这个平台提供虚拟显卡的租赁服务,让那些使用性能不足设备如笔记本电脑和廉价个人电脑的用户也能畅玩高端游戏。借助GeForce Now,黄仁勋已为未来某一天可能终结其长达25年的核心业务做好了准备,因为他深知,如果自己不主动变革,就会有别人来取代他。在黄仁勋眼中,这样的做法对切博塔尔的时间利用并不高效。他认为,曲棍球的物理参数完全可以在计算机上进行模拟。事实上,“模拟”这一理念在黄仁勋的职业生涯中一直占据重要地位。凡是能模拟的事物,他都会尝试去模拟,而这通常也为他带来了丰厚的利润和创新的产品。现在他明白了,仅仅模拟一件事是远远不够的;他得模拟所有事物。“我们得构建一个替代宇宙。”黄仁勋表示。

云GPU服务就是AI 工厂的雏形,模拟就是今天Ominiverse的原型,一切都开始快十年了,不是新鲜事。

乌斯科雷特期望能构建一个神经网络,其智能程度能随阅读量的增长而提升。在2014年的某个时刻,他脑海中闪现出一个创新理念:倘若更多的数据能带来更出色的成果,那么处理这些信息的底层架构理应尽可能简洁。他的这一灵感源自生物学——医学扫描显示,在人类大脑中约1 000亿个神经元里,仅有不到1%的神经元负责语言处理。“语言或许正是为了充分利用我们的认知能力,才以这样的方式进化而来。”他在2023年的一次访谈中如此表述。项目尾声,团队进行了“消融”实验,故意关闭部分Transformer代码以探究其作用。但出人意料的是,消融实验竟让核心Transformer功能表现更佳。沙泽尔大刀阔斧地剔除冗余代码,最终所剩无几。最原始形态的Transformer简洁至极,几乎不超过20行代码。

语言的重要性正是因为其1%的神经元占用,却驱动了100%的大脑。这个关键之处也带给我对现在ChatGPT的重新思考,如果不理解这个2个数量级之间的关系和语言的特别之处,就很难理解一个聊天窗口如何能在未来带给我们AGI了。

GPT-1于2018年6月问世。它通过学习BookCorpus来掌握阅读技能。BookCorpus是一个包含了约7 000本免费出版物电子书的开源文本语料库。GPT-2能够在没有明确训练的情况下回答新问题,这就是AI中“涌现”特性的一个例子。这些意想不到的技能和行为随着模型规模的扩大而涌现,甚至令研究人员感到惊讶。一旦模型跨过涌现的门槛,任何人,甚至连它的设计者,都无法说出它完全能够做些什么。GPT-1拥有约1亿个参数,相当于昆虫级别的大脑。GPT-2拥有15亿个参数,这规模好比一只小蜥蜴。而苏茨克弗的下一个模型目标,是达到1 000亿个参数——一只啮齿动物的级别。人类大脑可能拥有200万亿个突触;无论是否实现AGI,OpenAI都渴望超越这一数字。英伟达正在组建苏茨克弗所需的计算堆栈,这是一个集成的、仓库规模的解决方案。黄仁勋不再将其称为超级计算机或数据中心,而是称之为“AI工厂”。

200T模型才是下一步,才和人接近。千亿模型还是老鼠阶段。

AMD与英特尔均推出了CUDA的开源替代品,旨在帮助客户摆脱对英伟达硬件的层层依赖,从而有望节省数十亿美元的成本。然而,这些AMD或英特尔的产品却鲜有AI研究人员问津。这究竟是何缘故?英伟达之所以成功,并非因为它的电路更出众,而是因为它的软件更优秀。现如今,性能的提升中仅有一小部分来源于经典策略——在芯片中塞入更多的晶体管,毕竟摩尔定律已不再适用。而其余的性能提升,则归功于比尔·戴利、伊恩·巴克以及其他英伟达的科学家们,他们通过精妙的数值计算加速了矩阵乘法。2012—2022年,英伟达在单芯片AI推理性能上实现了惊人的千倍加速,这一成就远超摩尔定律以往的任何突破。其中,仅有2.5倍的加速来源于晶体管的增加,而高达400倍的加速则归功于英伟达的数学工具集。

英伟达的真正伟大之处在于CUDA。

2020年,OpenAI发布了GPT-3模型。直到2022年末,苏茨克弗及其团队发布了与最新OpenAI模型互动的聊天机器人ChatGPT,这些模型才开始受到世人的关注。这些模型的内部工作机制是保密的。此时,微软已向OpenAI的有限利润子公司投资了至少100亿美元,并不愿向竞争对手透露任何专有数据。据悉,ChatGPT为适应人类对话进行了微调,不仅利用了互联网文本,还融入了YouTube视频的转录和来自授权第三方来源的数据——保守估计,该模型至少包含1万亿个参数,与猫大脑中的突触数量相当。

猫!但不是一般的猫,而是会说话的猫,掌握语言技能的猫,强大的猫、带来革命性改变的猫!甚至,就连猫这个词似乎都和上个互联网时代的modem猫有异曲同工之妙了,难以言表。

5. 股价与投资

2001年夏季至2002年秋季,英伟达的股价暴跌超过90%,黄仁勋的财富也随之大跌。问题的源头可以追溯到2002年1月,当时美国证券交易委员会对英伟达的财务操作展开了调查。此类调查曾揭露出世通公司(Worldcom)和安然公司通过虚报利润进行的欺诈行为,引发了人们对企业欺诈的广泛怀疑。

互联网泡沫的时刻,NV其实是盈利企业,不是纸面富贵玩眼球经济、入不敷出的那种,但居然也能够暴跌如此之多。真是倾巢之下,安有完卵?

而CUDA带来的最大的隐性成本,可能是它分散了黄仁勋对核心客户服务的关注。早在2006年底,就有传闻称英伟达的产品存在问题,游戏玩家抱怨笔记本电脑中的GPU在使用数周后会停止工作。当问题被确认时,游戏论坛上已充斥着各种阴谋论,发帖者指责英伟达错误地将芯片连接到了电路板下的焊接“凸点”上。“凸点门”事件爆发,游戏玩家开始转向竞争对手,英伟达股价再次暴跌,6年内第二次损失了近90%的市值。董事会成员查看股票图表时,甚至将其比作心脏病发作时的心电图。

一次产品事故,就又能带来一次90%的暴跌。这次是业绩亏损了。

2016年,英伟达的股价飙升了224%,这让黄仁勋重获荣光,再度跻身亿万富翁行列。不过,在当年的标准普尔500指数中,表现最抢眼的股票并非英伟达,而是其长期竞争对手AMD,其股价涨幅高达309%。

这个点入场依然不晚,但如果进入到AMD,就成了一场灾难。这样的时刻如果选作投资的话,AMD一定是最稳定的,不够冒险,却是最差的结果。还是要All IN真正想去投资的,而不是在该冒险时选择保守。

2017年1月,英伟达宣布首次实现年利润10亿美元。2017年底,英伟达的利润已增长至年初的3倍,高达30亿美元,其各条产品线的增长均呈现迅猛态势。这家曾被人忽视的显卡公司,如今已成为华尔街的重要角色,市值更是达到了惊人的1 000亿美元。

这个时刻去投资,依然有50x的回报了。所以投资时刻永远不晚。唯一的问题是今天,今年NVDA的净利润过1000亿美元了,还能继续参与吗?天花板已经是要触碰全球GDP了。

6. 趣事

不过,他已经得到了LSI创始人科里根的支持。次日,黄仁勋与普里姆便前往红杉资本办公室,向以直言不讳著称的创始人唐·瓦伦丁(Don Valentine)进行推介。瓦伦丁常向初创公司提出的问题是:“谁在乎呢?”推介会的进展并不顺利,黄仁勋在演示中磕磕绊绊,而普里姆则时不时插入一些与主题不相关的技术细节。在这次令人失望的表现之后,瓦伦丁把黄仁勋拉到一旁。“嗯,表现得不太理想,”他说道,“但科里根和我说必须资助你们,所以你们可以开始干活了。

论贵人的重要性。决定性的结论早在见面之前就做出了。

英伟达以其芯片架构命名来致敬过去的杰出科学家:居里、特斯拉、费米、开普勒、麦克斯韦、帕斯卡、图灵、伏打、安培、洛夫莱斯、霍普以及布莱克威尔。随后的芯片组中包含了专为AI设计的电路,确保了数据中心托盘的持续升级需求。这种每6个月一次的升级周期引发了供应商们的抢购热潮,为机器学习领域的先锋们带来了巨大的利润。

下一代已经是Vera Rubin了,这样的命名方式真好。忘记历史就意味着背叛,将历史嵌套进产品,相信能更好的面对未来。

发布在Book | 发表评论