职位详情
大模型量化 分布式训练 推理加速 深度学习
预训练 大模型算法 自然语言处理算法 微调
岗位职责
1.模型研究与算法验证
-负责大语言模型技术研究,主导模型训练策略优化及性能验证,提升模型在复杂场景下的准确性与鲁棒性。
- 推进模型微调、量化压缩、推理加速等技术落地,解决训练过程中的工程难题(如分布式并行、内存优化)。
2.数据与实验管理
- 构建高质量训练数据集,设计数据清洗、标注及合成方案,确保数据质量与多样性。
-设计实验方案并复现前沿模型,通过对比实验验证技术路线可行性。
3.技术落地支持
- 协同团队完成模型部署与调优,优化推理延迟与吞吐量,支持端侧/云端多场景应用。
- 输出技术文档与专利,推动研究成果在智能数据治理、知识治理、文本挖掘、人机交互等领域的商业化落地。
任职要求
1.教育背景
- 计算机科学、人工智能或相关专业硕士及以上学历,有扎实的数学与算法基础。
2.技术能力
- 精通PyTorch/TensorFlow等框架,熟悉
DeepSpeed、LlamaFactory等分布式训练工具,掌握模型并行、流水线并行等优化技术。
-具备强化学习研究经验,有顶会论文或开源项目贡献者优先。
3.工程实践
- 熟悉Linux系统与Docker或K8s,具备大规模数据处理与模型调优经验,能独立解决GPU集群、网络通信等工程问题。
4.加分项
- 有数据治理、等垂直领域模型落地经验者优先。 -熟悉模型可解释性分析或自动化评测工具(如 BLEU、ROUGE)。