職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
職位描述:
1. 支持搜索/OCR/NLP等各方向算法模塊的落地和優(yōu)化
2. 方向一:負責深度模型性能優(yōu)化,提升大規(guī)模在線推理集群的吞吐,降低時延,保證在線服務可用性;
3. 方向二:負責分布式模型訓練框架的開發(fā)和優(yōu)化,提升整體訓練流程的效率
職位要求:
1. 熟悉linux環(huán)境,熟悉C/C 和Python,熟悉GPU體系結構
2. 熟悉至少一種推理引擎,有引擎/算子開發(fā)部署經驗,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用訓練平臺,熟悉OpenMMLab/HuggingFace等算法模型池,有實際應用經驗
加分項:
1. 有CUDA編程經驗優(yōu)先
2. 有推理服務實際部署和優(yōu)化經驗優(yōu)先
3. 熟悉ONNX、TorchScript等模型轉換格式優(yōu)先
4. 熟悉模型量化、蒸餾、剪枝等壓縮方法,有相關應用經驗者優(yōu)先
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)東軟大廈作業(yè)幫
