- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:茗谈149:赤雁 -- 本嘉明
懂的人,一句标题就能点到要害,比如老虎河友;比如陈王提的本地部署、Hugging Face transformers(包括open-source PyTorch),以及高带宽的交互 ---- 这些与超级数据中心各组件一起,才能构成完整的大规模AI训练环境
以下是我单位与NVIDIA合作的一张教学概念图(不涉密),“高带宽的交互”,懂的都懂
这栋楼里,懂技术与不懂技术的,从其选择相信的“段子来源”,一目了然。
譬如前几天我去一朋友家过年party ,席间DeepSeek肯定是跑不掉的讨论热点。好玩的是,我这DS发布当天本公司股票跌了17%的“受害者”都没着急上火,而来自华尔街一个朋友却急得破口大骂,内容与本楼里一些诸如“5万卡”的段子,一模一样,分明是同一个宣传口发出来的通稿:
我就纳闷了 ---- 如今华尔街玩股票的经纪人,比我们这些相关技术人员更懂AI啊(我老婆正经的模式识别出身,微笑静听,一言不发)
最后那位华尔街人,破口大骂老黄,就差骂黄是通共的“美奸”了😄
莫非中美竞争,真到了“天下何人不通共”的熟悉阶段?呵呵
华尔街人,信这种通稿,持这种通态,恰恰印证了国内朋友去年的两句话:
(1)AI概念短期热炒背后不是科技领域的重大突破,而是💵金融,此乃美国之根本
(2)去年5月(中国)就很多人看明白这里面的门道了
最后分享河里某位久未露面的老河友,托人带我的一句话:“现在的ds模型只是过渡”
来日方长,拭目以待
- 相关回复 上下关系8
压缩 5 层
🙂取决于如何定义LPU 12 陈王奋起 字416 2025-02-07 23:27:48
🙂用大量SRAM来换取速度的设计都是没前途的。 史蒂芬周 字34 2025-02-10 01:05:32
🙂碰到懂技术的了。 他估计是搞成了PPO 1 戒定慧 字0 2025-02-07 08:24:42
🙂陈王是懂相关技术的人,老虎河友也是
🙂真正的西方专家还是不敢明着跳出来诋毁的 17 梓童 字364 2025-02-04 22:58:51