职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
注:急招职位,待遇可谈,要求有推理优化经验。研发团队直招,非猎头职位。
职位描述:
1. 支持搜索/OCR/NLP等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责LLM大模型推理/训练优化
职位要求:
1. 熟悉linux环境,熟悉C/C 和Python,熟悉GPU体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用训练平台,熟悉OpenMMLab/HuggingFace等算法模型池,有实际应用经验
加分项:
1. 有CUDA编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉ONNX、TorchScript等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
职位描述:
1. 支持搜索/OCR/NLP等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责LLM大模型推理/训练优化
职位要求:
1. 熟悉linux环境,熟悉C/C 和Python,熟悉GPU体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用训练平台,熟悉OpenMMLab/HuggingFace等算法模型池,有实际应用经验
加分项:
1. 有CUDA编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉ONNX、TorchScript等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
工作地点
地址:北京海淀区北京海淀区上地街道中关村软件园
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。