职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1. 负责大模型增量预训练、高效微调、推理优化和效果评估等,并在汽车后市场领域场景中实现落地
2. 研发迭代检索增强、链式推理、事实一致性和可控性文本生成等技术
3. 负责问答系统的内容安全,指令安全、隐私安全等
4. 追踪NLP/多模态等大模型前沿技术
任职要求:
1. 熟练掌握NLP基础理论和算法,有NLP相关行业经验,熟练掌握Transformer系列模型架构和原理
2. 熟练掌握python编码语言,熟练使用pytorch、tensorflow、paddle等至少一种深度学习框架
3. 熟悉使用deepspeed、megatron、colossal-ai等至少一种大模型分布式训练框架,了解langchain原理以及llama、chatglm等常见开源基座大模型
4. 责任心强,有较强的自驱力,善于利用业界优质模型,从0到1推动业务发展,以及较强的沟通协作能力。