热点资讯
偷拍摄视影视先锋 你的位置:步非烟 足交 > 偷拍摄视影视先锋 > 父女乱伦电影 英伟达CPO,掀翻新大战
父女乱伦电影 英伟达CPO,掀翻新大战发布日期:2025-03-27 05:01    点击次数:185

父女乱伦电影 英伟达CPO,掀翻新大战

如果您但愿不错通常碰头父女乱伦电影,接待标星保藏哦~

起原:内容编译自IEEE,谢谢。

东谈主们期待已久的新兴策划机采集组件可能终于迎来了它的时期。在上周于圣何塞举行的Nvidia GTC行为上,该公司晓喻将坐褥一种光纤采集交换机,旨在大幅胁制 AI数据中心的功耗。该系统称为共封装光学器件(CPO)交换机,每秒可将数十兆比特的数据从一个机架中的策划机路由到另一个机架中的策划机。

如今,在数据中心中,策划机机架中的采集交换机由专用芯片构成,这些芯片通过电气步地与插入系统的光收发器相连(机架内的贯串是电气的,但有几家初创公司但愿改变这一近况)。可插拔收发器邻接了激光器、光电路、和其他电子斥地。它们与交换机培植电气贯串,并在交换机端的电子比特和沿光纤穿过数据中心的光子之间转机数据。

共封装光学器件是一种通过将光/电数据转机尽可能围聚交换芯片来进步带宽并胁制功耗的法子。这简化了建树,并通过减少所需的零丁组件数目和电子信号必须传输的距离来检朴电力。先进的封装期间使芯片制造商或者用多个硅光收发器芯片包围采集芯片。光纤顺利贯串到封装上。因此,除激光器外,通盘组件王人集成到一个封装中,激光器保合手外部,因为它们是使用非硅材料和期间制造的。(即便如斯,CPO 只需要 Nvidia 硬件中每八个数据链路一个激光器。)

共封光学:很强,很难

尽管这项期间看起来很有迷惑力,但其经济性防碍了它的部署。“咱们一直在恭候 CPO,”加州大学圣巴巴拉分校的聚拢封装光学巨匠、IEEE 研究员Clint Schow说,他仍是研究这项期间 20 年了。谈到 Nvidia 对这项期间的招供,他示意该公司“除非到了 [GPU 密集型数据中心] 无法承担电力资本的时候,不然不会这样作念。”因为其所触及的工程相配复杂,Schow 以为除非“旧法子被冲破”,不然它是不值得的。

Omdia 数据中心策划和采集巨匠 Manoj Sukumaran 对此举充满温雅,称其为“信得过的大事”。他告诉咱们,共封装光学器件是一项“酝酿已久”的期间。该期间、供应商和轨范漫衍在各个小公司偏执定制处罚决议中。

“这项期间莫得轨范化,因此即使在超大范围 CSP 中也莫得得到平凡选择。

IDC EMEA 高档研究总监 Andy Buss示意,即就是今天,10G 以太网关于铜 RJ45 贯串来说,每个端口的功耗仍然很高,而当咱们以高数据速率使用现时的光收发器和可插拔模块时,每个模块的功耗是不言而谕的——而且跟着所需的采集贯串数目的增多,每个模块的功耗会速即增多,成为一个垂危的耗电斥地。每个收发器的功耗可能在 20W 到 40W 之间,是以这不是微不及谈的——而且这不仅需要供电,还需要冷却。

事实上,Nvidia 也将行将到来的 AI 数据中心的功耗看成其动机。Nvidia超大范围和高性能策划副总裁Ian Buck示意,可插拔光学器件破钞了 AI 数据中心“总 GPU 功耗的 10%” 。在一个领有 40 万个 GPU 的工场中,这相配于 40 兆瓦,其中一半以上仅用于为可插拔光学收发器中的激光器供电。“领有 40 万个 GPU 的 AI 超等策划机本色上需要 24 兆瓦的激光器,”他说。

Jensen 在他的主题演讲中强调了这少量。该公司宣称功耗胁制了 70%,从 1.6T 可插拔收发器的 30W 胁制到每个 1.6T CPO 端口仅 9W。Nvidia的 CPO 基于新的微环调制器 (MRM),可零碎进步功率服从。

不外,正如IDTechEx 所说,异构集成是共封装光学器件 (CPO) 的关键,它使光学引擎 (OE)(包括光子 IC (PIC) 和电子 IC (EIC))与开关 ASIC 或 XPU 集成在单个封装基板上。CPO 的封装法子通常期为两种:一种触及光学引擎自己的封装,另一种侧重于光学引擎与 ASIC 或 XPU 等 IC 的系统级集成。这两种法子王人需要使用先进的 2.5D 和 3D 半导体封装期间。

光子和电子元件的集成不错通过多种法子扫尾,每种法子王人有不同的优点,也靠近着特定的挑战。

2D 集成触及将 PIC 和 EIC 并列放弃在印刷电路板 (PCB) 上,并通过引线键合或倒装芯片期间进行贯串。这种法子的优点是封装期间苟简、复杂度低、资本效益高。然则,流毒包括显耀的寄生电感,这会导致信号竣工性问题和高能耗。此外,由于间距为止和对单边贯串的依赖,全体 I/O 功能被重组。总体而言,天然 2D 集成相对容易封装,但使用引线键合会为止收发器带宽并增多能耗,使其不太合适高性能应用。

2.5D 集成通过将 EIC 和 PIC 装置到配备硅通孔 (TSV) 的无源中介层上,提供了一种折中决议。该法子通过使用微凸块或铜柱来减少 EIC 和 PIC 之间的封装寄奏效应,从而扫尾更高的 I/O 贯串并扫尾更详尽的布线以增多带宽。此外,中介层的使用允许加入波导层,这不错增强光信号再行分拨并撑合手更好的信号竣工性。然则,这种法子也带来了一系列挑战。与 2D 集成比拟,2.5D 集成的开发和制酿资本更高。此外,天然 2.5D 集成在 2D 集成的基础上有所改良,但它的寄奏效应仍然高于 3D 集成,这会影响全体性能。

3D 混书籍成选择更先进的法子,使用先进的半导体封装期间(举例硅通孔 (TSV)、高密度扇出、Cu-Cu 搀杂键合或有源光子中介层(使用 PIC 看成中介层,如图所示))将 EIC 堆叠在 PIC 之上。通常,3D 集成法子可显耀减少寄奏效应并撑合手密集间距配置,从而进步性能。然则,握住散热是一项挑战,因为来自 EIC 的热量会影响 PIC,因此需要先进的热管交融决决议。

在这些不同的封装法子中,硅通孔 (TSV) 期间因其在电力传输和通讯服从方面的上风而被视为集成 EIC 和 PIC 的关键期间之一。TSV 可最大限制地胁制电压降和电感,为关键组件提供可靠电力,同期胁制互连距离以改善通讯。尽管由于硅的介电特色,高频下存在信号竣工性挑战,但 TSV 更光滑的金属名义有助于缩小趋肤效应,使其成为高档 EIC/PIC 集成的盼愿选拔。据念念科称,其第三代光学引擎选择了 3D TSV(硅通孔)先进封装期间。TSV 的使用处罚了电源竣工性瓶颈问题,该瓶颈是由向高频责任的 PIC 上的有源器件有用传输电力的挑战以及 EIC 中有源器件数目的增多而引起的。

3D Cu-Cu 搀杂键合期间可撑合手个位数微米范围内的凸块间距,正成为最小化 EIC/PIC 接口寄奏效应的关键处罚决议。该期间已用于高端处理器,通过减少寄奏效应提供显耀上风,从而胁制功耗并进步性能。台积电通过其 SoIC 期间(品牌为 COUPE)推动这一法子,用于堆叠 EIC 和 PIC,旨在左右搀杂键合扫尾超卓的集成服从和性能。

3D 单片集成是起初进的期间,面前仍在开发中,它触及将光子元件镶嵌现存电子工艺节点,而编削极小。这种法子将有源光子和电子元件集成在统一芯片中,通过拔除对接口焊盘和凸块的需求,减少了寄奏效应并简化了封装。然则,它通常依赖于较旧的 CMOS 工艺节点,这可能导致光子性能欠安和能耗较高。尽管存在这些为止,3D 单片集成仍可减少阻抗失配并简化封装。

跟着共封装光学器件 (CPO) 成为高端数据中心的关键处罚决议,封装期间的选拔仍在积极商讨和研究中。每种集成法子王人有独到的上风和挑战,不仅要接洽光学引擎的封装,还要接洽触及 IC(交换机 ASIC/XPU)和光学引擎共同联想的概括系统集成。

英伟达的处罚决议:信得过苟且的期间

在主题演讲中,黄仁勋示意:“将 GPU 推广到数十万个的挑战在于横向推广的贯串。当数据中心当今有通顺场那么大时,咱们需要一些[新]东西 - 而这恰是硅光子学的用武之地。”

他补充谈:“硅光子学的挑战在于收发器破钞大王人能源。咱们晓喻推出 Nvidia 首款共封装 [光学] 硅光子系统。

“这是全国上第一个 1.6 Tb/s CPO,基于一种称为微环调制器 (MRM) 的期间。它彻底选择台积电这种令东谈主难以置信的工艺期间制造而成。”

黄仁勋将这一解析形容为“信得过苟且的期间”,并将通常用于通过采集交换机贯串 GPU 的传统 Mach-Zehnder 可插拔收发器与 Nvidia 的最新解析进行了比较。

他指出父女乱伦电影,如今每个 GPU 王人需要六个零丁的收发器,这意味着每个 GPU 的功耗为 180 瓦,资本为 6000 好意思元。“问题是:咱们当今如何推广到数百万个 GPU?”首席履行官说。“因为如果咱们有 100 万个 GPU,咱们需要 600 万个收发器,破钞 180 兆瓦。”

下图透露了所触及的好多其他组件的概览,发轫是台积电制造的电子和光子 IC,并以 3D 堆栈拼装。台积电的紧凑型通用光子引擎 (COUPE) 期间包括一个用于名义耦合到光纤阵列的微透镜。在 Quantum-X Photonic 平台的情况下,光学引擎组件通过中介层贯串到交换机 ASIC。

如下图所示,Nvidia 的CPO 相助伙伴名单包括 Browave、Coherent、Corning、Fabrinet、Foxconn、Lumentum、Senko、SPIL、Sumitomo、TFC 和台积电。当中,他们还长远先容了与台积电的相助。

在一段视频,英伟达先容了台积电制造的“Quantum-X”封装如何邻接 18 个硅光子引擎,通过 36 个激光输入扫尾 324 个光贯串和 288 个数据链路。

六个可拆卸光学子组件贯串到封装,每个子组件包含三个硅光引擎,可提供 4.8 Tb/s 的总额据隐隐量。每个硅光引擎王人具有一个 200 Gb/s MRM,选择台积电的“ COUPE ”(紧凑型通用光子引擎)工艺制造,该工艺在 1000 个光子集成电路 (PIC) 上堆叠了 2.2 亿个晶体管。

总体而言,与传统的可插拔收发器法子比拟,该法子可将功耗胁制 3.5 倍。

黄仁勋在谈到这一解析时示意:“这险些是一个期间古迹”,并补充说,Nvidia 将在本年下半年启动出货硅光子交换机,随后在 2026 年下半年推出 Spectrum-X 家具。

他补充说,借助英伟达夙昔五年来一顺利力于研发的硅光子期间,数据中心不错检朴“数十兆瓦”的电力破钞。

Lumentum 为新友换机提供激光器,该公司云和采集期间业务总裁 Wupen Yuen 褒贬谈:“大幅胁制采集功耗的革命将扩大光子元件阛阓,撑合手更大的东谈主工智能装置,并加快从铜到光子互连的过渡。”

Coherent 首席履行官 Jim Anderson 在我方的公告中补充谈:“咱们很繁荣能成为 Nvidia 在这种新式收发器方面的相助伙伴。咱们瞻望 CPO 将进一步加快数据中心光纤采集的推广。”

Nvidia 采集高档副总裁 Gilad Shainer 示意,Nvidia 与 Lumentum 和 Coherent 在激光器和硅光子学方面的相助将扫尾下一代“百万级东谈主工智能”。

“通过将硅光子学顺利集成到交换机中,Nvidia 冲破了超大范围和企业采集的旧为止,并怒放了百万 GPU AI 工场的大门。”

Nvidia 示意,在新的 AI 数据中心选择 CPO 交换机将使激光器数目减少四分之一,数据传输的功率服从进步3.5 倍,使信号从一台策划机准时传输到另一台策划机的可靠性进步 63 倍,使采集抵抗中断的才能进步 10 倍,并允许客户以更快 30% 的速率部署新的数据中心硬件。

该公司规划推出两类交换机,Spectrum-X 和 Quantum-X。Quantum-X 将于本年晚些时候上市,它基于Infiniband采集期间,这是一种更面向高性能策划的采集决议。它从 144 个端口中的每一个端口提供 800 Gb/s 的速率,它的两个 CPO 芯片选择液冷而不是风冷,越来越多的新 AI 数据中心也选择这种冷却步地。采集ASIC包括 Nvidia 的SHARP FP8期间,该期间允许 CPU 和 GPU 将某些任务卸载到采集芯片上。

Spectrum-X 是一款基于以太网的交换机,可通过统统 128 或 512 个端口提供约 100 Tb/s 的总带宽,并通过 512 或 2048 个端口提供 400 Tb/s 的总带宽。瞻望硬件制造商将在 2026 年准备好 Spectrum-X 交换机。

Nvidia 多年来一顺利力于基础光子期间的研究。但它需要与台积电、康宁和富士康等 11 家相助伙伴相助,才能将这项期间推向买卖化阶段。

Nvidia 光学互连家具总监 Ashkan Seyedi 强调,这些相助伙伴带来的期间必须共同优化以欢叫 AI 数据中心的需求,而不是苟简地从这些相助伙伴现存的期间中拼装起来。

“CPO 带来的革命和节能后果与你的封装决议、封装相助伙伴和封装经由密切关连,”Seyedi 说谈。“革命之处不单是在于光学元件自己,还在于它们如何故高产、可测试的步地进行封装,从而让你或者以合理的资本进行握住。”

测试尤为垂危,因为该系统集成了好多奋发的组件。举例,Quantum-X 系统的两个 CPO 中各有 18 个硅光子芯片。每个芯片王人必须贯串到两个激光器和 16 根光纤。Seyedi 示意,团队必须开发几种新的测试设施才能确保测试正确,并跟踪缺欠出现的位置。

Nvidia 并不是唯独一家推出选择同封装光学器件的采集交换机的公司。博通亦然当中一个垂危玩家。

光调制器:英伟达和博通的根底区别

Micas Networks本周晓喻推出 51.2T 家具,该家具基于 Broadcom 的 51.2 Tbps Bailly CPO 交换机平台,提供 128 个 400G 以太网端口。

Broadcom 的 CPO 提供了 50% 的功耗胁制(通过移除 DSP),但它基于 Mach-Zehnder 调制器 (MZM)——光收发器中的轨范组件。

博通光学系统部门家具营销高档司理罗伯特·汉娜 (Robert Hannah)解释说,博通为其Bailly CPO 交换机选拔了更为熟悉的 Mach-Zender 调制器,部分原因是它是一种更为轨范化的期间,可能更容易与现存的可插拔收发器基础设施集成。

Micas 的系统使用单个 CPO 组件,该组件由 Broadcom 的Tomahawk 5 以太网交换机芯片和八个 6.4 Tb/s 硅光子光学引擎构成。该风冷硬件现已全面参预坐褥,最初于 Nvidia 的 CPO 交换机。

汉娜称 Nvidia 的参与是对 Micas 和博通时机的招供。“几年前,咱们决定滑向冰球将要到达的场合,” Micas 首席运营官米奇·加尔布雷斯(Mitch Galbraith) 示意。他说,跟着数据中心运营商争相为其基础设施提供能源,CPO 的时期似乎仍是到来。

与使用轨范可插拔收发器的系统比拟,这款新友换机有望检朴 40% 的功耗。不外, Micas 公司企业策略副总裁Charlie Hou示意,CPO 更高的可靠性一样垂危。“链路抖动”是指可插拔光纤链路的瞬时故障,是导致仍是相配长的 AI 进修运行时间蔓延的罪魁罪魁之一,他说。CPO 瞻望链路抖动会更少,因为信号旅途中的组件更少,还有其他原因。

如上所述,Broadcom 的决议与 Nvidia 的决议之间的一个根底区别是光调制器期间,该期间将电子比特编码到光束上。硅光子学中主要有两种类型的调制器 - Mach-Zender(Broadcom 所选择的何况是可插拔光学器件的基础)和微环谐振器(Nvidia 所选拔的)。在前者中,穿过波导的光被分红两个平行的臂(arm)。然后,每个臂不错通过施加的电场进行调制,从而改变通过的光的相位。然后,这两个臂再行贯串形成单个波导。字据两个信号当今是否同相或异相,它们将相互对消或合并。因此,电子比特不错编码到光上。

微环调制器紧要凑得多。它不是将光沿着两条平行旅途分开,而是在光的主旅途一侧吊挂一个环形波导。如果光的波长不错在环中形成驻波,它将被抽走,从而将该波长从主波导中过滤掉。究竟哪种波长与环产生共振取决于结构的折射率,而折射率不错通过电子步地进行操控。

然则,微环的紧凑性是有代价的。微环调制器对温度敏锐,因此每个调制器王人需要内置加热电路,必须留神规矩加热电路,而且会破钞电力。另一方面,Mach-Zender 斥地要大得多,导致更多的光损结怨一些联想问题,Schow 说。

Schow 示意,Nvidia 顺利将基于微环的硅光子引擎买卖化是“一项了不得的工程豪举”。

改日的 CPO

Schow 示意,大型数据中心但愿从 CPO 取得的节能后果主如若一次性的。之后,“我以为这将成为新常态。”不外,电子斥地其他功能的改良将使 CPO 制造商或者赓续进步带宽——至少在一段时间内。

Schow 怀疑单个硅调制器(在 Nvidia 的光子引擎中以 200 Gb/s 的速率运行)能否进步 400 Gb/s。不外,其他材料(如铌酸锂和磷化铟)应该或者进步这个速率。关键在于以可承受的价钱将它们与硅元件集成在一齐,圣巴巴拉的OpenLight等团体正在研究这个问题。

与此同期,可插拔光学器件也并非一成不变。本周,博通推出了一款新式数字信号处理器,该处理器可使 1.6 Tb/s 收发器的功耗胁制 20% 以上,部分原因在于选择了更先进的硅工艺。

Avicena、Ayar Labs和Lightmatter等初创公司正在勉力将光学互连引入 GPU 自己。前两家公司仍是开发出不错与 GPU 或其他处理器装入统一封装中的芯片。Lightmatter 更进一步,将硅光子引擎看成改日芯片 3D 堆叠的封装基板。

有名光学分析机构lightcounting在其著述中示意,横向推广采集是低风险的 CPO 切入点,但纵向推广光纤互连更为关键。搀杂巨匠 (MoE) 模子的快速反当令间需要巨匠并行性,即跨 GPU 分别巨匠。Jensen 解释了隐隐量和反当令间之间的量度,他的示例展示了一个最好点,即需要巨匠并行 64,这意味着巨匠被分别到 64 个 GPU 实例中。Blackwell 一代 NVL72 机架使用 NVLink 在无源铜背板(或骨干)上创建了一个 72-GPU 纵向推广域。Nvidia 将在 2H26 中为 Vera Rubin NVL144 使用近似的联想,可能会将无源电缆的数目增多一倍。

Nvidia遮挡了 Rubin Ultra NVL576 联想的细节,但 Kyber 机架布局显着为 NVLink 互连引入了新的条款。尽管如斯,144 个 GPU 封装仍可装入单个机架中,因此最大笼罩范围约为 2 米。道路图不详了 Feynman 预期的 NVLink 范围,但咱们坚信它将推广到多个机架,届时将需要光学器件。

Nvidia在 GTC 2022 上初次晓喻了通过光纤扫尾 NVLink 的规划。该公司在里面构建了至少一个这样的集群,但重定时光收发器的高功耗关于平凡部署来说是不行能的。拔除 DSP 是上前迈出的一步,但需要为改日的改良开辟谈路。这就是 Nvidia 冒险使用 MRM 等新期间的原因。接洽到推广才能的垂危性,该公司可能正在研究平凡的新光学期间。NVLink

CPO 的 2028 年时间表为 Nvidia 提供了两代东谈主在横向推广汇蚁合解说其期间的契机。这将胁制 GPU 不行幸免地转向 CPO 的风险,这只是时间问题,而不是是否的问题。

https://spectrum.ieee.org/co-packaged-optics

半导体杰作公众号推选

专注半导体畛域更多原创内容

关注大家半导体产业动向与趋势

大伊香蕉人在线一视频

*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或撑合手,如果有任何异议,接待连接半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第4075期内容,接待关注。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

心爱咱们的内容就点“在看”共享给小伙伴哦