工作地点:上海
1、负责设计、实现和优化前沿大模型(多模态等方向),构建高性能、可复用的模型架构。
2、结合自研芯片的能力,针对不同场景(如边缘计算、实时推理)优化大模型性能,平衡精度与效率(如模型压缩、量化、剪枝)
3、维护并扩展Model Zoo核心库,确保代码高质量与可扩展性(如模块化设计、自动化测试)。
4、制定模型标准化规范(如输入输出格式、训练数据集兼容性),提升用户体验。
5、撰写技术文档与教程。
1、计算机科学、人工智能、数学或相关领域本科及以上学历;
2、有在SOC厂商或相关NPU厂商部署过大模型的经验优先;
3、主导过至少一个高性能模型开发项目(如ImageNet分类器、BERT-like NLP模型); 有模型部署到边缘设备的实战经验(如Jetson、AWS SageMaker);
4、熟悉模型压缩技术(知识蒸馏、剪枝、量化)、部署优化(ONNX、TensorRT、OpenVINO);
5、熟悉CI/CD流程、Git协作、容器化部署;
6、精通Python,熟悉PyTorch/TensorFlow框架