基于机器学习与深度学习的光伏发电功率预测

用气象传感器数据预测未来 1 小时光伏发电功率:时序特征工程 + 七模型双轨对比(Ridge/XGBoost/LightGBM 对阵 LSTM/GRU/Transformer/CNN-LSTM)+ TOPSIS 选模 + SHAP 可解释性,一条完整的新能源功率预测流水线——代码、文档、配图全配齐。

  • 任务类型时序与信号
  • 专业方向能源 · 电气/自动化 · 计算机 · 数据科学

数据与任务

样本量2 座光伏电站 · 34 天 · 15 分钟级 SCADA
核心方法时序特征工程 + 7 模型对比
技术栈PyTorch · LightGBM · SHAP

如果你想找一个既贴着「双碳 / 新能源」热点、又能在面试和答辩里讲明白的 AI 项目,这个「光伏发电功率预测」很合适。

它的方向很有看点——新能源 + 机器学习 + 深度学习时序模型,落点也实在:电网调度最头疼的就是光伏出力忽高忽低,能提前一小时预报功率,对消纳、储能、调峰都有直接价值。配套也都给你备齐了,帮你真正搞懂它、在面试和答辩里讲清楚:带中文注释、能读懂的代码,一份从背景一直讲到 SHAP 解释的技术文档,把面试可能被追问的点连参考答案都写好的项目讲解资料,还有一整套能直接做 PPT 的配图。

flowchart LR A["光伏电站<br/>气象 + 发电数据"] --> B["时序特征工程<br/>(辐照度/滞后/太阳高度角)"] B --> C["七模型双轨对比<br/>ML + 深度学习"] C --> D["TOPSIS + 熵权法<br/>客观选模"] C --> E["SHAP<br/>可解释性"] D --> F["预测未来 1 小时<br/>发电功率"] E --> F

先说清楚,它到底在做什么

光伏发电完全看天吃饭:太阳一出力就上来、云一遮就掉下去,出力曲线随辐照度剧烈起伏。电网要平衡供需,就得提前知道下一个小时这座电站大概能发多少电——这就是「光伏功率预测」,是新能源并网调度里最核心的一环。难点在于,功率不只跟当下的辐照度、温度有关,还有很强的时间依赖:此刻的出力跟前几个小时高度相关;同时要把这种时序规律变成模型能用的特征,还得严防"拿未来信息预测未来"的数据泄漏。

这个项目从 2 座光伏电站的逆变器级发电数据加电站级气象传感器数据出发,搭了一条完整的时序预测流水线:先做数据探索,摸清辐照度与功率的非线性关系、以及发电的日周期特性,再用辐照度交互、太阳高度角、时间周期编码、功率滞后与滚动统计把原始数据扩成 31 维时序特征,然后让机器学习和深度学习两条路线的七种模型同台竞技,用 TOPSIS 客观选出综合最优模型,最后用 SHAP 把"哪些因素最影响发电功率"讲清楚。

辐照度-功率关系散点图(颜色表示组件温度)
辐照度与发电功率的非线性关系,颜色代表组件温度——辐照越强功率越高,但高温会拖低效率,这正是项目把"辐照度平方""辐照度×温度"做成交互特征的物理依据。

搞懂它,你能在面试里讲清楚什么

把下面几件事吃透,面试官顺着问下来你都能接得住。

时序特征怎么构建,又怎么防数据泄漏。 这是整个项目的地基,也是时序题最容易被追问的点。你要能讲清楚:预测 t+4(1 小时后)的功率,所有特征只能用到 t 时刻及之前的信息,所以功率滞后特征至少要错开 4 步、滚动统计也要先 shift 再算。再配上太阳高度角的天文估算、时间的 sin/cos 周期编码、辐照度交互项,把一张普通的气象表扩成信息量足够的 31 维时序表示——既有光伏的物理先验,又有历史功率的动态信息。

光伏发电功率 24 小时日周期分布
发电功率的日周期特性——夜间为零、正午达峰,呈钟形曲线。看懂这张图,就能讲清为什么时间编码和太阳高度角是光伏预测里信息量最大的特征。

为什么机器学习和深度学习两条路线一起上。 项目同时对比了 Ridge/XGBoost/LightGBM 三种机器学习模型,和 LSTM/GRU/Transformer/CNN-LSTM 四种深度学习时序模型。你能借此讲清楚两条路线的根本差别:树模型吃的是一张展平的特征表,深度学习吃的是滑动窗口切出来的序列;并能说明循环网络与注意力机制如何捕捉光伏出力的时序依赖,以及为什么最终要靠 TOPSIS 把拟合优度、误差、训练耗时这些此消彼长的指标客观地综合到一起来选模,而不是只盯着一个 R²。

GRU 预测功率与真实功率时序对比
预测功率与真实功率的逐时对比——四个完整的发电日周期里,预测曲线整体贴合真实出力的涨落节奏,能直观讲清模型抓住了"日出爬升、正午达峰、日落回落"的规律,也能顺势讲清正午高值处略有封顶、欠预测的现象。

SHAP 怎么把模型讲成"看得懂的影响因素"。 SHAP 能排出哪些特征最推动功率预测,让黑盒变透明——太阳高度角、时间编码、辐照度、历史功率这些因素的作用一目了然,跟光伏发电的物理常识完全对得上。你能借此讲清楚模型不是瞎拟合,而是学到了合理的规律。

下面这组分析图也都给你做好了,可以直接放进答辩或面试 PPT

SHAP 特征重要性
SHAP 特征重要性排序
SHAP 蜂群影响图
SHAP 特征影响蜂群图
预测值 vs 真实值散点
预测 vs 真实功率散点

更关键的是,每张图怎么跑出来的、该怎么解读,技术文档里都讲清楚了——你能说明白每张图到底说明了什么。

面试官会问的,都帮你备好了

随便感受几个这个项目真实会被追问的问题:

  • 预测 1 小时后的功率,怎么保证特征里没有混进未来信息(数据泄漏)?滞后和滚动统计为什么都要先 shift?
  • 树模型和 LSTM/GRU 吃的输入有什么本质区别?序列样本是怎么从扁平特征里切出来的?
  • 为什么用 TOPSIS+熵权法选模,而不是直接挑 R² 最高的那个?

看到会愣一下?正常。配套的项目讲解资料把这个项目——从整体思路到每个流程细节、各种可能被追问的点——连参考答案都给你写好了。另外还有现成的简历描述,照着改就能写进简历;那套配图也能直接套进 PPT 模板,快速出一份面试 / 答辩 PPT。

配套资料:搞懂一个项目需要的,这里全都有

先看那份技术文档——从项目背景、数据探索、时序特征工程,一直讲到七模型对比、TOPSIS 选模与 SHAP 解释,图文并茂、推导清楚:

文档封面
封面 + 目录
最优模型分析页
最优模型预测分析
SHAP 可解释性页
SHAP 可解释性分析

代码也给你了——关键部分都带着中文注释,帮你读懂"它到底是怎么实现的"

时序特征工程代码
滞后 / 滚动特征(严防数据泄漏)
TOPSIS 评价代码
熵权法 + TOPSIS 综合评价

技术文档、项目讲解资料、源码注释、整套配图——搞懂一个项目、并在面试里讲清楚它,需要的全都备齐了。

适合谁

不管你是赶毕设、想给简历添个有分量的项目,还是在准备面试,这个题目都接得住。专业上,新能源、电气工程、电力系统、智慧电网、能源管理,以及计算机与数据科学方向都很合适。光伏功率预测是新能源并网调度里的刚需任务,把这条从时序特征工程到模型对比、再到可解释性的完整流水线真正搞懂、能讲出来,就是一个既踩中行业热点、又撑得起面试的项目。

想把这样的项目做成你简历上的亮点?

这是一套配齐了代码、文档、面试问答和配图的 AI+X 项目,可写进简历、在面试里讲清楚。 想做同类项目、或获取「基于机器学习与深度学习的光伏发电功率预测」的完整资料(代码 / 数据处理流程 / 论文文档 / 配图), 请联系为你介绍本页面的老师咨询,按你的情况定一个合适的项目。