職位描述

職位描述:1、在短視頻和直播場景下,結(jié)合圖像,聲音,文字等,對視頻進(jìn)行理解,包括但不限于音頻分離、音頻檢測與分類、語音識別、語種識別、音樂理解等;
2、推動音頻理解算法在快手短視頻相關(guān)應(yīng)用上的落地;
3、追蹤多模態(tài)視頻理解的前沿算法和技術(shù),保持算法先進(jìn)性。
任職要求:1、機(jī)器學(xué)習(xí)、模式識別、信號處理等計算機(jī)相關(guān)專業(yè)的碩士或者博士;
2、有多模態(tài)技術(shù)、音頻分離和生成等相關(guān)經(jīng)驗者優(yōu)先;
3、熟練掌握C/C 、Python,有較強(qiáng)的工程實現(xiàn)能力。熟悉常見的機(jī)器學(xué)習(xí)算法工具,如tensorflow,pytorch等;
4、相關(guān)頂會或期刊上發(fā)表論文者優(yōu)先(ICASSP,Interspeech,ACL,ICML,NIPS,CVPR等);
5、有團(tuán)隊精神,良好的表達(dá)能力和溝通能力。
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)上地西路6號快手總部
