職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
基于公司自研AI芯片及平臺,開發高性能計算庫,包括:
1.負責通用計算庫(FFT、BLAS、DNN、RNG、SPARSE、OpenCV)的應用在硬件平臺上的并行算法設計;
2.與芯片/架構團隊緊密配合,持續優化算子性能,完善軟硬件堆棧;
3.評測和分析算子性能瓶頸,提出性能優化方案;
4.跟蹤高性能計算領域前沿技術的發展,如編譯優化和稀疏計算;
1.負責通用計算庫(FFT、BLAS、DNN、RNG、SPARSE、OpenCV)的應用在硬件平臺上的并行算法設計;
2.與芯片/架構團隊緊密配合,持續優化算子性能,完善軟硬件堆棧;
3.評測和分析算子性能瓶頸,提出性能優化方案;
4.跟蹤高性能計算領域前沿技術的發展,如編譯優化和稀疏計算;
1.本科及以上學歷;計算機、信息、通信、自動化、電子、數學等相關專業;
2.熟練掌握C/C 語言;
3.熟悉并行計算方法及其設計,熟悉CUDA或OpenCL或SYCL或HIP編程;
4.有高性能計算/人工智能實際工程經驗優先;
5.有較強的工作主動性和良好的溝通能力,能承受一定的工作壓力,愿意接受挑戰。
工作地點
地址:長沙岳麓區景嘉微
