1. 負責產品的功能測試、性能測試、自動化測試等工作,涵蓋大模型服務、數據平臺等。
2. 制定迭代版本驗收標準及對應測試計劃,設計和執行大模型落地產品的測試集及測試用例,評估系統的功能、性能和準確性。
3. 分析測試結果,發現和報告問題,推動系統的改進和優化。
4. 與其他團隊成員協作,推動項目的進展,確保模型的質量和可靠性。
5. 撰寫測試報告,記錄測試結果和問題,評估其合理性、準確性、場景匹配度,為團隊提供有價值的反饋。
6. 協助設計新的測試場景或任務流程,用于模型能力的覆蓋性評估。
職位要求:
1. 計算機科學、軟件工程、人工智能等相關專業本科及以上學歷。
2. 5年以上軟件測試經驗,2年以上AI/大模型測試經驗。
3. 熟悉NLP、深度學習模型的測試方法與評測指標。
4. 熟練掌握Python編程語言,精通Pytest、unittest等測試框架。
5. 有良好的邏輯思維和問題分析能力,善于總結行為模式或失敗原因;
6. 以下至少有一項需要滿足:(最好至少滿足大模型測試方向)
加分項:有LLM大模型相關項目經歷
加分項:有0-1負責新項目經歷或小組管理經驗
加分項:全鏈路性能測試方案設計、執行能力
加分項:有提效平臺搭建能力
