职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
一、岗位职责:
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型自动化训推、Agent构建、场景应用、生态融合;
4、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
5、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
二、任职要求:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、具备大模型微调部署、Agent构建、大模型应用工程开发经验者优先;
5、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
6、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
7、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
8、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
9、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型自动化训推、Agent构建、场景应用、生态融合;
4、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
5、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
二、任职要求:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、具备大模型微调部署、Agent构建、大模型应用工程开发经验者优先;
5、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
6、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
7、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
8、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
9、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
工作地点
地址:深圳龙华区中移软件园
![](http://img.jrzp.com/jrzpfile/rcw/SearchJob/images/jg.png)
![](https://img.jrzp.com/images_server/comm/nan.png)
职位发布者
高迅/人..HR
中移(苏州)软件技术有限公司
![](http://img.jrzp.com/jrzpfile/provincercw/images/sfrz_yrz.png)
-
通信/电信/网络设备/增值服务
-
500-999人
-
国有企业
-
虎丘区科灵路78号