跳至主要内容

機器學習工程師ChatGPT提示詞2026|ML必備Prompt模板

最後更新:2025年12月 | 適用於ChatGPT、Claude、DeepSeek等AI模型

為什麼機器學習工程師需要專業的Prompt?

機器學習涉及資料處理、特徵工程、模型設計、訓練調優等多個環節。使用專業的Prompt可以讓ChatGPT提供更專業的ML建議和程式碼實現。

使用本頁Prompt的優勢

  • 快速編寫資料處理Pipeline
  • 高效設計模型架構
  • 系統化的調參策略
  • 完整的MLOps方案

核心角色Prompt(複製即用)

你现在是一名拥有8年经验的资深机器学习工程师,你:
- 精通PyTorch、TensorFlow、Scikit-learn等框架
- 擅长深度学习、NLP、CV、推荐系统等领域
- 有丰富的特征工程和模型调优经验
- 熟悉MLOps和模型部署生产化

请以这个专业身份回答问题。回答时:
1. 提供可直接运行的代码
2. 解释算法原理和设计思路
3. 给出性能优化建议
4. 考虑工程实践和生产部署

一、資料處理 📊

資料清洗

場景Prompt模板
缺失值處理請用Python處理這個資料集的缺失值,特徵型別:[數值/類別/時序]
異常值檢測請實現[特徵]的異常值檢測和處理,使用[IQR/Z-score/孤立森林]
資料平衡訓練集類別不平衡(1:100),請給出處理方案和程式碼

特徵工程

場景Prompt模板
特徵構造請為[業務場景]設計特徵工程方案,原始特徵:[特徵列表]
特徵選擇請用[過濾法/包裝法/嵌入法]篩選重要特徵,目標變數:[描述]
特徵編碼請為這些類別特徵選擇編碼方式:[特徵列表及基數]

資料增強

場景Prompt模板
影象增強請設計影象資料增強Pipeline,任務是[分類/檢測/分割]
文字增強請實現NLP資料增強,方法:回譯、同義詞替換、隨機插入
表格增強請用SMOTE/GAN方法增強表格資料

二、傳統機器學習 🔧

模型選擇

場景Prompt模板
演算法選型[業務問題]應該用什麼演算法?資料量[X],特徵數[Y],要求可解釋
模型對比請對比XGBoost、LightGBM、CatBoost在[場景]下的優劣
整合方法請設計模型融合方案,基模型:[模型列表]

模型訓練

場景Prompt模板
訓練程式碼請用Scikit-learn實現[演算法]訓練,包含交叉驗證和網格搜尋
超參調優請為[模型]設計超參搜尋空間和調優策略
特徵重要性請分析模型的特徵重要性並視覺化

模型評估

場景Prompt模板
評估指標[業務場景]應該用什麼評估指標?請解釋選擇原因
模型診斷模型AUC只有0.6,請給出診斷和改進思路
過擬合處理訓練集準確率95%,測試集60%,如何解決過擬合?

三、深度學習 🧠

模型設計

場景Prompt模板
CNN架構請用PyTorch實現[ResNet/EfficientNet],輸入[尺寸],類別數[N]
Transformer請實現[BERT/GPT]風格的Transformer架構
自定義網路請設計一個網路解決[問題],輸入[描述],輸出[描述]

訓練技巧

場景Prompt模板
訓練迴圈請實現完整的PyTorch訓練迴圈,包含早停、學習率排程、混合精度
損失函式[場景]應該用什麼損失函式?請實現自定義Loss
最佳化器選擇AdamW vs Lion vs SAM,哪個更適合[任務]?

模型除錯

場景Prompt模板
梯度問題訓練時loss不下降/爆炸,請給出排查思路
過擬合請實現正則化方法:Dropout、權重衰減、資料增強
視訊記憶體最佳化視訊記憶體不夠,請給出最佳化方案:梯度累積、混合精度等

四、NLP任務 📝

文字處理

場景Prompt模板
文字預處理請實現中文文字預處理:分詞、去停用詞、詞向量
Tokenizer請用Hugging Face實現[模型]的tokenizer
文字向量化請對比TF-IDF、Word2Vec、BERT embeddings的適用場景

模型應用

場景Prompt模板
文字分類請用BERT實現[任務]的文字分類,資料格式:[描述]
命名實體請實現NER任務,使用[BiLSTM-CRF/BERT-CRF]
文字生成請用GPT-2實現文字生成,包含取樣策略

大模型應用

場景Prompt模板
微調方案請設計[大模型]的微調方案,使用[LoRA/QLoRA/全量微調]
Prompt工程請為[任務]設計Few-shot Prompt模板
RAG系統請設計RAG系統架構,包含向量資料庫選型

五、CV任務 🖼️

影象處理

場景Prompt模板
資料載入請用PyTorch實現影象資料載入和預處理Pipeline
增強策略請用Albumentations實現[任務]的資料增強

模型應用

場景Prompt模板
影象分類請用[模型]實現影象分類,支援遷移學習
目標檢測請實現[YOLO/Faster R-CNN]目標檢測
影象分割請實現語義分割,使用[U-Net/DeepLab]

六、MLOps 🚀

實驗管理

場景Prompt模板
實驗追蹤請用MLflow/Weights&Biases記錄實驗
版本管理如何管理資料版本和模型版本?
超參管理請用Hydra/OmegaConf管理配置

模型部署

場景Prompt模板
模型匯出請將PyTorch模型匯出為[ONNX/TorchScript]
服務部署請用[FastAPI/TorchServe]部署模型服務
效能最佳化請最佳化推理效能:量化、剪枝、蒸餾

監控運維

場景Prompt模板
模型監控請設計模型上線後的監控指標
資料漂移如何檢測和處理資料漂移?
A/B測試請設計模型A/B測試方案

使用技巧

  1. 說明資料情況:資料量、特徵型別、類別分佈
  2. 明確任務目標:分類、迴歸、生成、推薦
  3. 指定框架版本:PyTorch 2.0、TensorFlow 2.x等
  4. 考慮資源限制:視訊記憶體大小、訓練時間、部署環境

相關資源