《東方看點|英偉達(dá)即將發(fā)布L40s, 算力應(yīng)用交相輝映》
時間:2023-08-09
英偉達(dá)近期預(yù)告即將推出L40s,L40s的推出主要針對小幾百億參數(shù)模型推理(行業(yè)垂直應(yīng)用)、相關(guān)模型微調(diào)訓(xùn)練等無需高顯存容量和帶寬場景。目前大卡緊缺,小卡推理算力利用率極低,高質(zhì)量推理算力極為緊缺,同時L40s專門優(yōu)化了【FP32】的算力。
東方基金權(quán)益研究部認(rèn)為,在使用ResNet50和Bert-Large經(jīng)典模型下,L40s的推理性能和性價比皆優(yōu)于A800。L40s的推出不受臺積電CoWoS產(chǎn)能限制,供給充足,有助于改善算力產(chǎn)業(yè)鏈的預(yù)期。有助于促進(jìn)行業(yè)垂直模型更加快速、低成本落地。L40s不是完全替代A800,一方面在推理端:應(yīng)用于小幾百億及其以下的參數(shù)模型的推理(例如一些垂域模型);另一方面在訓(xùn)練端:用于微調(diào)訓(xùn)練(基于已經(jīng)完成預(yù)訓(xùn)練的模型,做fine-tuning等)??紤]到A800和H800受制于臺積電CoWoS產(chǎn)能,缺貨嚴(yán)重,L40s有助于實現(xiàn)對上述需求的增量供給。A/H卡在千億甚至未來萬億級別參數(shù)的大模型推理,以及大模型的預(yù)訓(xùn)練階段仍然是不可替代的。建議關(guān)注人工智能的應(yīng)用端以及算力端發(fā)展。
市場有風(fēng)險,投資需謹(jǐn)慎。
|
關(guān)閉本頁 打印本頁 |