building-agents/llm.txt

51 lines
3.1 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

目前的能源系统结构主要由太阳能发电站、风能发电站、发电机和电池模块通过电力网与住宅相连接。以下是中文和符号的对照:
As电池的充电状态动作Ag1发电机1的功率动作Ag2发电机2的功率动作Ag3发电机3的功率动作Av太阳能的电压动作
Sp电价状态Sc电池荷电状态Sl住宅负载状态Sg1发电机1功率状态Sg2发电机2功率状态Sg3发电机3功率状态St温度状态Si太阳辐射度状态Sw风速状态
Pc电池充放电功率Pg1发电机1功率Pg2发电机2功率Pg3发电机3功率Pso太阳能功率Pw风能功率
Cb电池成本Cg1发电机1成本Cg2发电机2成本Cg3发电机3成本Cs太阳能成本Cw风能成本Rs销售收入Cp购买成本Ee过剩能源Es短缺能源Pe过剩惩罚Ps短缺惩罚。
一、控制方案和目标:
1、优先使用太阳能和风能发电当无法满足满负荷时请使用发电机和电池供电。
2、在供电时考虑多种供电来源太阳能、风能、发电机和电池综合每个发电模块的成本需满足下一时刻的住宅用电负载且使供需差异最小化。
3、减少超过公网交易限额的交易以避免公共电网波动影响住宅用电的稳定性。
4、最大化奖励函数并最小化能源不平衡。
二、连续状态空间是一个长度为9的向量包含以下部分
Sp由数据提供Sc初始为0.4始终介于0.2和0.8Sl由数据提供
Sg1初始功率为0Sg2初始功率为0Sg3初始功率为0
St由数据提供Si由数据提供Sw由数据提供。
其中ScSg1、Sg2和Sg3始终不小于0。
三、连续动作空间一个长度为5的向量x表示当前时间的取值, 其范围从-1到1每个时刻的值都是在上一时刻基础上进行变化的Ag1、Ag2和Ag3分别表示相对于各自最大瞬时功率100、100和200的变化值。
1、Ac电池总容量为500初始电池容量为500*0.4=200电池容量变化100*x
2、Ag1发电量变化100*x
3、Ag2发电量变化100*x
4、Ag3发电量变化200*x
5、Av太阳能电压变为(1+x)倍。
可根据需求通过改变功率控制发电机的开关当关闭时保持Sg=0当打开时需满足Pg约束。根据成本通常前一台发电机的最大功率不足以满足剩余负荷时才开启后续发电机。
四、发电量计算公式
1、Pc = max(0.2, min(0.8, Sc + 0.2 * action[0] * 0.9))其中0.8和0.2为电池荷电状态上下限;
2、Pg1 = max(0, min(150, 100 * action[1] + Sg1))其中150和0为发电机1开启时发电量上下限
3、Pg2 = max(0, min(375, 100 * action[2] + Sg2))其中375和0为发电机2开启时发电量上下限
4、Pg3 = max(0, min(500, 200 * action[3] + Sg3))其中500和0为发电机2开启时发电量上下限
5、Pso = max(0, (0.2 * Si + 0.05 * St - 9.25) * (1 + action[4]))其中太阳能发电功率不小于0。
6、Pw与Ws有关
if 3 <= Ws < 8, Pw = Ws^3 * 172.2625 / 1000
elif 8 <= Ws < 12, Pw = 64 * 172.2625 / 125
else Pw = 0
五、成本和能源平衡计算
P = Pc + Pg1 + Pg2 + Pg3 + Pso + Pw
if P >= Sl , Ee = P Sl, else Es = Sl - P
1、Cb = 0.01 * Asoc + 0.1 * Sc
2、Cg1 = 0.0034 * Pg1^2 + 3 * Pg1 + 30
3、Cg2 = 0.001 * Pg2^2 + 10 * Pg2 + 40
4、Cg3 = 0.001 * Pg3^2 + 15 * Pg3 + 70
5、Cs = 0.01 * Pso
6、Cw = 0.01 * Pw
7、Rs = 0.5 * Sp * Ee
8、Cp = Sp * Es
9、Pe = (Ee - 100) * 50
10、Ps = (Es - 100) * 50
因为Rs、Pe和Cp、Ps对应能源过剩和能源短缺情况只能同时存在一组。
六、奖励函数
Reward = - (Cb + Cg1 + Cg2 + Cg3 + Cs + Cw + Pe + Ps - Rs + Cp) / 1000
七、请求动作数据
读取数据并使用上述公式计算每个时刻的状态请你使用最合适的优化方法给出每个时刻的动作控制方案每小时计算一次并生成一个长度为5的数组表示Ac、Ag1、Ag2、Ag3和Av的动作决策。返回的数据应为以下Json格式[{x1, x2, x3, x4, x5}, {x1, x2, x3, x4, x5}, ..., {x1, x2, x3, x4, x5}]