讲话会,啊,我是负责解说企业和这个科技牵头的高层啊。
呃,讲话会包括的是,呃,中国的话呢,这个,呃,长兴的啊这样的一个这个招股书啊这样的一个非常的一个火爆。
啊,大家的话呢也是看到它的一个这个预测的这个利润啊,包括,收益的这样的一个利润。
那么大家的话呢,应该呢感受到的话呢,也是非常强的这样的一个这个,呃,爆发性。
然后的话呢也是,啊,非常的一个这个兴奋啊。
啊,那么这一点上的话呢,我是看到我们常见的老师了,包括我们,啊,从硅谷,然后这个泰国前期调研之后,其实我们在前面的这个讲话会当中的话也是多次的去强调,啊这样的一个存储的这个三口这样的一个超级周期的这个持续性。
就大家看到这个数据的一个这个爆发性,包括会给估值啊这样的一个这个情况啊。
那我们来想一下啊,这个事情的这个本质的这个原因,包括这个持续性会如何啊?包括一些海外的这种顶尖的这种公司一个情况,帮大家能够更好的了解这个行业的这个持续性以及成长的一个情况上才是现在这个最关键的一个事情。
啊,那么存储行业的话呢,就是它整个这个基本原理的话呢,其实非常这个简单,因为无论是大模型的大型阶段,还是在比较主流的P D分离的这个口子阶段,啊,那么他们的话呢,其实更多的考虑的是做,呃,就是它要一次一次的去调用这个T V T里面的这样的一个这个量。
然后的话呢,需要很大的这样的一个存储量啊,在分解以及这种比较高的这样的一个货年的这个带宽、最大的存储的一个方式。
我们其实,在那个硅谷啊,然后进行新的这种呃T V T压压缩的方式,包括像这个啊T P啊T V T的压缩方式当中,我们其实也给大家提出了一个比较重要的这个重点,就是目前啊硅谷最强的这个团队,你需要压T V T的话呢,要么就是压啊存取啊,要么的话呢就是去压缩这个token啊,要么要么的话呢是去,选一个新的这种调度的这个方式。
当然知道啊,从这个A I本到第二么到难的这样的一个offload的方式下的话呢,其实会需要有一个调度时间的这样一个损失。
所以,做做事儿的话呢,其实一样啊,就是如何在最小的这个调度量,最小的话呢,最好一个存取、好一个token的压缩的这个方式之下的话,呃,如何能够实现一个同等的效果?大家不可能期待我压缩的更好,然后同时呢一个更好的效果。
啊,那么从目前的这个整个硅谷和全球顶尖的压缩方式下,啊其实T P做的这样的一个啊操作方式啊,包括像在A I的这样的些方式其实的话呢啊,对全世界都有很强的借鉴意义啊,就是他们是对这个硬件潮流做方式,但是很难对大模型的效果是一个提升。
所以我们要保持同样的这个或者说基金的效果之下啊,在不同的场景之下的话呢,那么大家综合来看,其实现有的一个比较主流的途径之下,你很难压缩到甚至低于分之一下啊。
然后的话呢,那么大家看到的话呢,这种大模型模型规模越来越大,现在三万亿参数可能这两年我们看到的是一个七千亿三万亿参数的这样的一个这个模型。
然后的话呢,啊,它也很难进行一个的压缩啊,然后啊,大家知道就是我即使进行的一个这个压缩啊,比如压缩到甚至更低,但我如果是保持同样的效果,可能哎,那我把这个存储的空间压缩了,需要一个更好的这个效果。
那这样的一个情况下的话呢,也会进行出现到一个这个技术的啊,随着存储的从大模型阶段出,那需要一个更好的模型、更好的效果。
所以说的话呢,我们其实不是一个说啊这样的一个模型效果更好,而是我们给了更多的算力,那么特别是更多的这个预率、更多的这个存力啊,那么是这样的一个概念。
然后的话呢,我们之前在美国的也调研过很多的这种全球的这个大厂啊,调研过很多全球的大厂啊。
那么我们看到的话呢,是他们其实在今年年初啊就收到了很多的意向订单啊。
当然在后面的话呢,呃,意向订单会有进一步的这个提升啊。
但是大家的话呢,大家知道这个存储的一个投产其实需要两年的时间,才两年左右的时间产出的这个效果,所以二六年投产至少在八年才能体现。
所以大家很难期待说在二七年这个的产能的爆发。
那么可能会担心呢?那么在八年的话呢,那会不会由于扩产的一个变化的话呢,会导致这个八年这个产能的话呢,就是会有冗余啊?那么导致大家的话呢会出现这个导致大家的话呢会出现价格下降啊。
那我想一下几个大厂啊,包括大家看到的这种A U,包括大家看到的这个A I历史,包括大家看到三七啊,包括在难的阶段的像三七这种公司扩产的一个基本逻辑。
那么它在今年年初收到的意向订单啊,那么大扩产三十万扩产的这个四厂的管理,他们是意向订单的一半产的来扩产的啊,且后面的话意向订单的这个产值会进一步这个扩张啊。
呃,所以的话呢,呃,那么这个角度来看的话呢,就是说这个意向订单啊,那么这一块来看的话呢,是远远不够满足的啊。
且在后面的话,意向订单还加,这是方面。
另一方面的话呢,我们看这个大模型的根本逻辑就是预多的啊这样的一个存储空间又高的这个带宽,长货年对吧?这个其实光也是P D的这个逻辑会导致这个模型更好的一个效果。
所以大家有使用这个模型的一个效果的话呢,其实不管用多好还是用什么,不是说呃他们的这个不是说他们的这个模型的建的一个不好啊,是它给可能很多人的这样的一个效果的话呢,是考虑了这个算力压缩啊,考虑了这样的一个几个月几个月存储、带宽的这个情况下的一个最终的一个效果啊。
所以的话呢,其实呃整个的这个存储从理论上来看啊,这个需求,包括带宽的需求,可能是比现有的一个实际的情况要上几个数量级的。
但是基于这种基本之初啊的这个情况的话,所以的话呢,我们看整个一个在A I的这样的一个投资A I的一个新量持续的情况下的话,那么存储仍然是现在仍然是包括大家会讲呃很多些经济区上的上有很你觉得其实存储仍然是最紧缺、最紧张的这样的一个环节。
所以,我们先看到什么?包括像三七这样的一个话,大家看到是二七年到年中的话呢,大家的一个这个产能的话呢,这个大家的这样的一个产能的话呢不高。
但是的话呢,实际上可能到今年底或者明年初的时候,我们会发现啊,不仅是二七年年中的这个产能被说完,那可能整个二八年的一个这个产能的话呢,也是实现了这个完全的一个锁定啊。
所以的话,其实整个需求比较长。
我们在硅谷会议当中的话呢,也是这块写的比较清楚啊。
🔊 源音频文件
