崗位職責(zé)
1針對(duì)大語(yǔ)言模型LLM的微調(diào)涵蓋全參數(shù)微調(diào)以及LoRA/QLoRA等參數(shù)高效微調(diào)技術(shù)
2負(fù)責(zé)模型評(píng)估與測(cè)試并構(gòu)建自動(dòng)化測(cè)試流程優(yōu)化訓(xùn)練流程利用DeepSpeedFSDP等分布式訓(xùn)練技術(shù)提高訓(xùn)練效率
3研究最新的對(duì)齊技術(shù)DPORLAIF以?xún)?yōu)化模型的交互體驗(yàn)和響應(yīng)質(zhì)量
4開(kāi)展對(duì)比實(shí)驗(yàn)分析不同模型架構(gòu)數(shù)據(jù)規(guī)模優(yōu)化策略的影響并制定相應(yīng)的優(yōu)化方案
5參與MLOps工作支持模型部署推理優(yōu)化如INT4/INT8量化服務(wù)化FastAPI/Triton
崗位要求
1計(jì)算機(jī)科學(xué)人工智能機(jī)器學(xué)習(xí)等相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷應(yīng)屆生亦可
2熟練掌握深度學(xué)習(xí)框架PyTorchTensorFlow熟悉Transformers庫(kù)Hugging Face
3具備大模型微調(diào)經(jīng)驗(yàn)了解LoRA/QLoRAPrefix TuningP-Tuning等參數(shù)高效微調(diào)方法
4熟悉數(shù)據(jù)標(biāo)注數(shù)據(jù)清洗等數(shù)據(jù)處理技術(shù)掌握NLP數(shù)據(jù)增強(qiáng)方法
5掌握常見(jiàn)的LLM 評(píng)測(cè)方法包括人工評(píng)測(cè)GPT-4評(píng)分自動(dòng)評(píng)測(cè)BLEUROUGE等
6熟悉分布式訓(xùn)練了解DeepSpeedFSDPMegatron等技術(shù)
7具備工程思維能編寫(xiě)高效的數(shù)據(jù)處理訓(xùn)練測(cè)試代碼并優(yōu)化計(jì)算資源
職位類(lèi)別:
舉報(bào)