跳到主要内容

机器学习工程师ChatGPT提示词2026|ML必备Prompt模板

最后更新:2025年12月 | 适用于ChatGPT、Claude、DeepSeek等AI模型

为什么机器学习工程师需要专业的Prompt?

机器学习涉及数据处理、特征工程、模型设计、训练调优等多个环节。使用专业的Prompt可以让ChatGPT提供更专业的ML建议和代码实现。

使用本页Prompt的优势

  • 快速编写数据处理Pipeline
  • 高效设计模型架构
  • 系统化的调参策略
  • 完整的MLOps方案

核心角色Prompt(复制即用)

你现在是一名拥有8年经验的资深机器学习工程师,你:
- 精通PyTorch、TensorFlow、Scikit-learn等框架
- 擅长深度学习、NLP、CV、推荐系统等领域
- 有丰富的特征工程和模型调优经验
- 熟悉MLOps和模型部署生产化

请以这个专业身份回答问题。回答时:
1. 提供可直接运行的代码
2. 解释算法原理和设计思路
3. 给出性能优化建议
4. 考虑工程实践和生产部署

一、数据处理 📊

数据清洗

场景Prompt模板
缺失值处理请用Python处理这个数据集的缺失值,特征类型:[数值/类别/时序]
异常值检测请实现[特征]的异常值检测和处理,使用[IQR/Z-score/孤立森林]
数据平衡训练集类别不平衡(1:100),请给出处理方案和代码

特征工程

场景Prompt模板
特征构造请为[业务场景]设计特征工程方案,原始特征:[特征列表]
特征选择请用[过滤法/包装法/嵌入法]筛选重要特征,目标变量:[描述]
特征编码请为这些类别特征选择编码方式:[特征列表及基数]

数据增强

场景Prompt模板
图像增强请设计图像数据增强Pipeline,任务是[分类/检测/分割]
文本增强请实现NLP数据增强,方法:回译、同义词替换、随机插入
表格增强请用SMOTE/GAN方法增强表格数据

二、传统机器学习 🔧

模型选择

场景Prompt模板
算法选型[业务问题]应该用什么算法?数据量[X],特征数[Y],要求可解释
模型对比请对比XGBoost、LightGBM、CatBoost在[场景]下的优劣
集成方法请设计模型融合方案,基模型:[模型列表]

模型训练

场景Prompt模板
训练代码请用Scikit-learn实现[算法]训练,包含交叉验证和网格搜索
超参调优请为[模型]设计超参搜索空间和调优策略
特征重要性请分析模型的特征重要性并可视化

模型评估

场景Prompt模板
评估指标[业务场景]应该用什么评估指标?请解释选择原因
模型诊断模型AUC只有0.6,请给出诊断和改进思路
过拟合处理训练集准确率95%,测试集60%,如何解决过拟合?

三、深度学习 🧠

模型设计

场景Prompt模板
CNN架构请用PyTorch实现[ResNet/EfficientNet],输入[尺寸],类别数[N]
Transformer请实现[BERT/GPT]风格的Transformer架构
自定义网络请设计一个网络解决[问题],输入[描述],输出[描述]

训练技巧

场景Prompt模板
训练循环请实现完整的PyTorch训练循环,包含早停、学习率调度、混合精度
损失函数[场景]应该用什么损失函数?请实现自定义Loss
优化器选择AdamW vs Lion vs SAM,哪个更适合[任务]?

模型调试

场景Prompt模板
梯度问题训练时loss不下降/爆炸,请给出排查思路
过拟合请实现正则化方法:Dropout、权重衰减、数据增强
显存优化显存不够,请给出优化方案:梯度累积、混合精度等

四、NLP任务 📝

文本处理

场景Prompt模板
文本预处理请实现中文文本预处理:分词、去停用词、词向量
Tokenizer请用Hugging Face实现[模型]的tokenizer
文本向量化请对比TF-IDF、Word2Vec、BERT embeddings的适用场景

模型应用

场景Prompt模板
文本分类请用BERT实现[任务]的文本分类,数据格式:[描述]
命名实体请实现NER任务,使用[BiLSTM-CRF/BERT-CRF]
文本生成请用GPT-2实现文本生成,包含采样策略

大模型应用

场景Prompt模板
微调方案请设计[大模型]的微调方案,使用[LoRA/QLoRA/全量微调]
Prompt工程请为[任务]设计Few-shot Prompt模板
RAG系统请设计RAG系统架构,包含向量数据库选型

五、CV任务 🖼️

图像处理

场景Prompt模板
数据加载请用PyTorch实现图像数据加载和预处理Pipeline
增强策略请用Albumentations实现[任务]的数据增强

模型应用

场景Prompt模板
图像分类请用[模型]实现图像分类,支持迁移学习
目标检测请实现[YOLO/Faster R-CNN]目标检测
图像分割请实现语义分割,使用[U-Net/DeepLab]

六、MLOps 🚀

实验管理

场景Prompt模板
实验追踪请用MLflow/Weights&Biases记录实验
版本管理如何管理数据版本和模型版本?
超参管理请用Hydra/OmegaConf管理配置

模型部署

场景Prompt模板
模型导出请将PyTorch模型导出为[ONNX/TorchScript]
服务部署请用[FastAPI/TorchServe]部署模型服务
性能优化请优化推理性能:量化、剪枝、蒸馏

监控运维

场景Prompt模板
模型监控请设计模型上线后的监控指标
数据漂移如何检测和处理数据漂移?
A/B测试请设计模型A/B测试方案

使用技巧

  1. 说明数据情况:数据量、特征类型、类别分布
  2. 明确任务目标:分类、回归、生成、推荐
  3. 指定框架版本:PyTorch 2.0、TensorFlow 2.x等
  4. 考虑资源限制:显存大小、训练时间、部署环境

相关资源