職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
注:急招職位,待遇可談,要求有推理優(yōu)化經(jīng)驗(yàn)。研發(fā)團(tuán)隊(duì)直招,非獵頭職位。
職位描述:
1. 支持搜索/OCR/NLP等各方向算法模塊的落地和優(yōu)化
2. 方向一:負(fù)責(zé)深度模型性能優(yōu)化,提升大規(guī)模在線推理集群的吞吐,降低時(shí)延,保證在線服務(wù)可用性;
3. 方向二:負(fù)責(zé)分布式模型訓(xùn)練框架的開發(fā)和優(yōu)化,提升整體訓(xùn)練流程的效率
4. 方向三:負(fù)責(zé)LLM大模型推理/訓(xùn)練優(yōu)化
職位要求:
1. 熟悉linux環(huán)境,熟悉C/C 和Python,熟悉GPU體系結(jié)構(gòu)
2. 熟悉至少一種推理引擎,有引擎/算子開發(fā)部署經(jīng)驗(yàn),如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用訓(xùn)練平臺(tái),熟悉OpenMMLab/HuggingFace等算法模型池,有實(shí)際應(yīng)用經(jīng)驗(yàn)
加分項(xiàng):
1. 有CUDA編程經(jīng)驗(yàn)優(yōu)先
2. 有推理服務(wù)實(shí)際部署和優(yōu)化經(jīng)驗(yàn)優(yōu)先
3. 熟悉ONNX、TorchScript等模型轉(zhuǎn)換格式優(yōu)先
4. 熟悉模型量化、蒸餾、剪枝等壓縮方法,有相關(guān)應(yīng)用經(jīng)驗(yàn)者優(yōu)先
職位描述:
1. 支持搜索/OCR/NLP等各方向算法模塊的落地和優(yōu)化
2. 方向一:負(fù)責(zé)深度模型性能優(yōu)化,提升大規(guī)模在線推理集群的吞吐,降低時(shí)延,保證在線服務(wù)可用性;
3. 方向二:負(fù)責(zé)分布式模型訓(xùn)練框架的開發(fā)和優(yōu)化,提升整體訓(xùn)練流程的效率
4. 方向三:負(fù)責(zé)LLM大模型推理/訓(xùn)練優(yōu)化
職位要求:
1. 熟悉linux環(huán)境,熟悉C/C 和Python,熟悉GPU體系結(jié)構(gòu)
2. 熟悉至少一種推理引擎,有引擎/算子開發(fā)部署經(jīng)驗(yàn),如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用訓(xùn)練平臺(tái),熟悉OpenMMLab/HuggingFace等算法模型池,有實(shí)際應(yīng)用經(jīng)驗(yàn)
加分項(xiàng):
1. 有CUDA編程經(jīng)驗(yàn)優(yōu)先
2. 有推理服務(wù)實(shí)際部署和優(yōu)化經(jīng)驗(yàn)優(yōu)先
3. 熟悉ONNX、TorchScript等模型轉(zhuǎn)換格式優(yōu)先
4. 熟悉模型量化、蒸餾、剪枝等壓縮方法,有相關(guān)應(yīng)用經(jīng)驗(yàn)者優(yōu)先
工作地點(diǎn)
地址:北京海淀區(qū)北京海淀區(qū)上地街道中關(guān)村軟件園


職位發(fā)布者
HR
作業(yè)幫

-
請(qǐng)選擇
-
公司規(guī)模未知
-
公司性質(zhì)未知
-
匯苑開拓大廈