T85_code/data_extract.ipynb

892 lines
56 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {
"collapsed": false,
"jupyter": {
"outputs_hidden": false
},
"pycharm": {
"name": "#%%\n"
}
},
"outputs": [],
"source": [
"import pandas as pd\n",
"import os"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {
"collapsed": false,
"jupyter": {
"outputs_hidden": false
},
"pycharm": {
"name": "#%%\n"
}
},
"outputs": [],
"source": [
"files_old = [x for x in os.listdir('./new_data/') if x.endswith('xls') and '经济性' in x]\n",
"files_new = [x for x in os.listdir('./火电20230313/火电20230313F/') if '经济性' in x]\n"
]
},
{
"cell_type": "code",
"execution_count": 3,
"outputs": [],
"source": [
"data = pd.read_excel(f'./new_data/{files_old[0]}', header=[3,4,5])"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 4,
"outputs": [
{
"data": {
"text/plain": "['序号',\n '机组编号',\n '时间',\n '发电量(万kWh)',\n '供电量(万kWh)',\n '标煤量t',\n '发电用标煤量t',\n '供热用标煤量t',\n '利用小时(h)',\n '平均负荷(MW)',\n '出力系数(%)',\n '出力系数(%)',\n '出力系数(%)',\n '工业供热量',\n '工业热电比(%)',\n '采暖供热量',\n '采暖热电比(%)',\n '总热电比(%)',\n '总供热量',\n '供热煤耗',\n '给水泵汽轮机总耗热量',\n '供电煤耗gce/(kWh)',\n '综合厂用电率(%)',\n '发电厂用电率(%)',\n '供热厂用电率(%)',\n '非生产厂用电率(%)',\n '最新THA工况二类修正后汽机热耗率kJ/KWh',\n '点火用油(kg/万kWh)',\n '助燃用油(kg/万kWh)',\n '主蒸汽压力(MPa)',\n '主蒸汽温度(℃)',\n '再热蒸汽温度(℃)',\n '高加投入率(%)',\n '给水温度(℃)',\n '真空严密性V(Pa/min)',\n '真空度(%)',\n '凝汽器端差(℃)',\n '凝结水过冷度(℃)',\n '发电补给水率(%)',\n '发电综合耗水率',\n '排烟温度(℃)',\n '飞灰含碳量(%)',\n '空预器漏风率(%)',\n '过热器减温水量(t/h)',\n '再热器减温水量(t/h)',\n '入厂煤低位热值(kJ/kg)',\n '入炉煤低位热值(kJ/kg)',\n '燃煤挥发份Var(%)',\n '燃煤灰份Aar(%)',\n '燃煤低位热值Qar,net(kJ/kg)',\n '燃煤硫份Sar(%)',\n '锅炉专业主要辅机耗电率 送风机耗电率(%)',\n '锅炉专业主要辅机耗电率 引风机耗电率(%)',\n '锅炉专业主要辅机耗电率 一次风机耗电率(%)',\n '锅炉专业主要辅机耗电率 炉水泵耗电率(%)',\n '锅炉专业主要辅机耗电率 给煤机耗电率(%)',\n '锅炉专业主要辅机耗电率 磨煤机耗电率(%)',\n '锅炉专业主要辅机耗电率 电除尘器耗电率(%)',\n '锅炉专业主要辅机耗电率 除灰系统耗电率(%)',\n '汽机专业主要辅机耗电率 凝结水泵耗电率(%)',\n '汽机专业主要辅机耗电率 前置泵耗电率(%)',\n '汽机专业主要辅机耗电率 电动给水泵耗电率(%)',\n '汽机专业主要辅机耗电率 循环水泵耗电率(%)',\n '汽机专业主要辅机耗电率 空冷风机耗电率(%)',\n '汽机专业主要辅机耗电率 热网循环水泵耗电率(%)',\n '环保专业耗电率 脱硫系统耗电率(%)',\n '环保专业耗电率 脱销系统耗电率(%)',\n '输煤专业耗电率输煤系统耗电率(%)',\n '化学系统耗电率 (%)',\n '化学系统耗电率 (%)']"
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"cols = [''.join([x for x in y if 'Unnamed' not in x]) for y in data.columns]\n",
"cols"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 5,
"outputs": [],
"source": [
"data_list = list()\n",
"for file in files_old:\n",
" data = pd.read_excel(f'./new_data/{file}', header=[3,4,5])\n",
" data.columns = cols\n",
" plant = file.split('-')[0]\n",
" data['时间'] = data['时间'].astype(str)\n",
" use_data = data[~data['时间'].str.contains('半年')].copy()\n",
" use_data['电厂名称'] = plant\n",
" data_list.append(use_data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 6,
"outputs": [],
"source": [
"for file in files_new:\n",
" data = pd.read_excel(f'./火电20230313/火电20230313F/{file}', header=[3,4,5])\n",
" data.columns = cols\n",
" plant = file.split('-')[0]\n",
" data['时间'] = data['时间'].astype(str)\n",
" use_data = data[~data['时间'].str.contains('半年')].copy()\n",
" use_data['电厂名称'] = plant\n",
" data_list.append(use_data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 7,
"outputs": [],
"source": [
"run_data = pd.concat(data_list, axis=0)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 8,
"outputs": [],
"source": [
"run_data.drop(columns=['序号'], inplace=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 10,
"outputs": [],
"source": [
"run_data.drop_duplicates(inplace=True)\n",
"run_data.reset_index(inplace=True, drop=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 11,
"outputs": [
{
"data": {
"text/plain": "(17616, 70)"
},
"execution_count": 11,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"run_data.shape"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 12,
"outputs": [],
"source": [
"run_data_max = run_data.groupby(['电厂名称', '机组编号', '时间']).max().reset_index()"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "markdown",
"source": [
"### 机组信息"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%% md\n"
}
}
},
{
"cell_type": "code",
"execution_count": 13,
"outputs": [
{
"data": {
"text/plain": "['中国中信集团公司-32020-电厂机组数据查询-20230313.xls',\n '中国中煤能源集团有限公司-34027-电厂机组数据查询-20230313.xls',\n '中国华电集团有限公司-21060-电厂机组数据查询-20230313.xls',\n '中国华能集团有限公司-17021-电厂机组数据查询-20230313.xls',\n '中国大唐集团有限公司-61005-电厂机组数据查询-20230313.xls']"
},
"execution_count": 13,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"old_units = [x for x in os.listdir('./new_data/') if '电厂机组' in x]\n",
"new_units = [x for x in os.listdir('./火电20230313/火电20230313/') if '电厂机组' in x]\n",
"new_units[:5]"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 14,
"outputs": [
{
"data": {
"text/plain": "['序号',\n '企业编码',\n '电厂名称',\n '简称',\n '机组编号',\n '铭牌容量 (MW)',\n '投产时间',\n '机组类型',\n '参数分类',\n '所处地区',\n '机组产地',\n '锅炉制造厂家',\n '汽轮机制造厂家',\n '发电机制造厂家',\n '主变压器制造厂家',\n '二级公司',\n '所属集团',\n '所属电网',\n '所属电网']"
},
"execution_count": 14,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"unit_samples = pd.read_excel(f'./new_data/{old_units[0]}', header=[3,4])\n",
"unit_cols = [''.join([x for x in y if 'Unnamed' not in x]) for y in unit_samples.columns]\n",
"unit_cols"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 15,
"outputs": [],
"source": [
"unit_list = list()\n",
"for file in old_units:\n",
" data = pd.read_excel(f'./new_data/{file}', header=[3,4])\n",
" data.columns = unit_cols\n",
" unit_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 16,
"outputs": [],
"source": [
"# unit_list = list()\n",
"for file in new_units:\n",
" data = pd.read_excel(f'./火电20230313/火电20230313/{file}', header=[3,4])\n",
" data.columns = unit_cols\n",
" unit_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 17,
"outputs": [],
"source": [
"units_df = pd.concat(unit_list).drop(columns=['序号', '所属电网']).drop_duplicates().reset_index(drop=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 18,
"outputs": [
{
"data": {
"text/plain": " 企业编码 电厂名称 简称 机组编号 铭牌容量 (MW) 投产时间 机组类型 参数分类 \\\n1388 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 2 630.0 1994-11-18 纯凝式 亚临界 \n1389 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 1 630.0 1991-10-30 纯凝式 亚临界 \n1390 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 3 660.0 2000-9-28 纯凝式 亚临界 \n1391 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 7 1000.0 2009-6-2 纯凝式 超超临界 \n1392 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 6 1050.0 2008-12-20 纯凝式 超超临界 \n1393 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 5 660.0 2000-7-28 纯凝式 亚临界 \n1394 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 4 660.0 2000-7-8 纯凝式 亚临界 \n1891 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 7 1050.0 2009-6-2 纯凝式 超超临界 \n\n 所处地区 机组产地 锅炉制造厂家 汽轮机制造厂家 发电机制造厂家 主变压器制造厂家 \\\n1388 浙江省 进口 加拿大巴布科克威尔科克斯公司 法国阿尔斯通 法国阿尔斯通 法国阿尔斯通公司 \n1389 浙江省 进口 美国燃烧工程公司 日本东芝公司 日本东芝公司 日本东芝公司 \n1390 浙江省 进口 日本石川岛播磨株式会社 日本东芝公司 日本东芝公司 日本东芝公司 \n1391 浙江省 国产 东方锅炉厂(东锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 保定天威保变电气股份有限公司 \n1392 浙江省 国产 东方锅炉厂(东锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 保定天威保变电气股份有限公司 \n1393 浙江省 进口 日本石川岛播磨株式会社 日本东芝公司 日本东芝公司 日本东芝公司 \n1394 浙江省 进口 日本石川岛播磨株式会社 日本东芝公司 日本东芝公司 日本东芝公司 \n1891 浙江省 国产 东方锅炉厂(东锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 保定天威保变电气股份有限公司 \n\n 二级公司 所属集团 \n1388 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1389 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1390 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1391 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1392 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1393 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1394 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n1891 北京国华电力有限责任公司 国家能源投资集团有限责任公司 ",
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>企业编码</th>\n <th>电厂名称</th>\n <th>简称</th>\n <th>机组编号</th>\n <th>铭牌容量 (MW)</th>\n <th>投产时间</th>\n <th>机组类型</th>\n <th>参数分类</th>\n <th>所处地区</th>\n <th>机组产地</th>\n <th>锅炉制造厂家</th>\n <th>汽轮机制造厂家</th>\n <th>发电机制造厂家</th>\n <th>主变压器制造厂家</th>\n <th>二级公司</th>\n <th>所属集团</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>1388</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>2</td>\n <td>630.0</td>\n <td>1994-11-18</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>浙江省</td>\n <td>进口</td>\n <td>加拿大巴布科克威尔科克斯公司</td>\n <td>法国阿尔斯通</td>\n <td>法国阿尔斯通</td>\n <td>法国阿尔斯通公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1389</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>1</td>\n <td>630.0</td>\n <td>1991-10-30</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>浙江省</td>\n <td>进口</td>\n <td>美国燃烧工程公司</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1390</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>3</td>\n <td>660.0</td>\n <td>2000-9-28</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>浙江省</td>\n <td>进口</td>\n <td>日本石川岛播磨株式会社</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1391</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>7</td>\n <td>1000.0</td>\n <td>2009-6-2</td>\n <td>纯凝式</td>\n <td>超超临界</td>\n <td>浙江省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>保定天威保变电气股份有限公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1392</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>6</td>\n <td>1050.0</td>\n <td>2008-12-20</td>\n <td>纯凝式</td>\n <td>超超临界</td>\n <td>浙江省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>保定天威保变电气股份有限公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1393</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>5</td>\n <td>660.0</td>\n <td>2000-7-28</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>浙江省</td>\n <td>进口</td>\n <td>日本石川岛播磨株式会社</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1394</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>4</td>\n <td>660.0</td>\n <td>2000-7-8</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>浙江省</td>\n <td>进口</td>\n <td>日本石川岛播磨株式会社</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>日本东芝公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>1891</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>7</td>\n <td>1050.0</td>\n <td>2009-6-2</td>\n <td>纯凝式</td>\n <td>超超临界</td>\n <td>浙江省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>保定天威保变电气股份有限公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n </tbody>\n</table>\n</div>"
},
"execution_count": 18,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_df[units_df['电厂名称']=='国能浙江北仑第一发电有限公司']"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 19,
"outputs": [
{
"data": {
"text/plain": "(1934, 16)"
},
"execution_count": 19,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_df.shape"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 20,
"outputs": [
{
"data": {
"text/plain": " 企业编码 电厂名称 简称 机组编号 铭牌容量 (MW) 投产时间 机组类型 参数分类 所处地区 \\\n1812 61022 陕西渭河发电有限公司 陕西省投咸阳渭河 3 320.0 1992-7-1 纯凝式 亚临界 陕西省 \n1928 61022 陕西渭河发电有限公司 陕西省投咸阳渭河 3 320.0 1992-7-1 纯凝式 亚临界 陕西省 \n\n 机组产地 锅炉制造厂家 汽轮机制造厂家 发电机制造厂家 主变压器制造厂家 二级公司 所属集团 \n1812 国产 上海锅炉厂(上锅) 哈尔滨汽轮机厂(哈汽) 哈尔滨电机厂(哈电) 沈变 NaN 陕西投资集团有限公司 \n1928 国产 上海锅炉厂(上锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 西安西电变压器厂 NaN 陕西投资集团有限公司 ",
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>企业编码</th>\n <th>电厂名称</th>\n <th>简称</th>\n <th>机组编号</th>\n <th>铭牌容量 (MW)</th>\n <th>投产时间</th>\n <th>机组类型</th>\n <th>参数分类</th>\n <th>所处地区</th>\n <th>机组产地</th>\n <th>锅炉制造厂家</th>\n <th>汽轮机制造厂家</th>\n <th>发电机制造厂家</th>\n <th>主变压器制造厂家</th>\n <th>二级公司</th>\n <th>所属集团</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>1812</th>\n <td>61022</td>\n <td>陕西渭河发电有限公司</td>\n <td>陕西省投咸阳渭河</td>\n <td>3</td>\n <td>320.0</td>\n <td>1992-7-1</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>陕西省</td>\n <td>国产</td>\n <td>上海锅炉厂(上锅)</td>\n <td>哈尔滨汽轮机厂(哈汽)</td>\n <td>哈尔滨电机厂(哈电)</td>\n <td>沈变</td>\n <td>NaN</td>\n <td>陕西投资集团有限公司</td>\n </tr>\n <tr>\n <th>1928</th>\n <td>61022</td>\n <td>陕西渭河发电有限公司</td>\n <td>陕西省投咸阳渭河</td>\n <td>3</td>\n <td>320.0</td>\n <td>1992-7-1</td>\n <td>纯凝式</td>\n <td>亚临界</td>\n <td>陕西省</td>\n <td>国产</td>\n <td>上海锅炉厂(上锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>西安西电变压器厂</td>\n <td>NaN</td>\n <td>陕西投资集团有限公司</td>\n </tr>\n </tbody>\n</table>\n</div>"
},
"execution_count": 20,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_df[(units_df['电厂名称']=='陕西渭河发电有限公司')&(units_df['机组编号']==3)]"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 21,
"outputs": [
{
"data": {
"text/plain": " 企业编码 电厂名称 简称 机组编号 铭牌容量 (MW) 投产时间 机组类型 参数分类 \\\n1391 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 7 1000.0 2009-6-2 纯凝式 超超临界 \n\n 所处地区 机组产地 锅炉制造厂家 汽轮机制造厂家 发电机制造厂家 主变压器制造厂家 \\\n1391 浙江省 国产 东方锅炉厂(东锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 保定天威保变电气股份有限公司 \n\n 二级公司 所属集团 \n1391 北京国华电力有限责任公司 国家能源投资集团有限责任公司 ",
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>企业编码</th>\n <th>电厂名称</th>\n <th>简称</th>\n <th>机组编号</th>\n <th>铭牌容量 (MW)</th>\n <th>投产时间</th>\n <th>机组类型</th>\n <th>参数分类</th>\n <th>所处地区</th>\n <th>机组产地</th>\n <th>锅炉制造厂家</th>\n <th>汽轮机制造厂家</th>\n <th>发电机制造厂家</th>\n <th>主变压器制造厂家</th>\n <th>二级公司</th>\n <th>所属集团</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>1391</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>7</td>\n <td>1000.0</td>\n <td>2009-6-2</td>\n <td>纯凝式</td>\n <td>超超临界</td>\n <td>浙江省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>保定天威保变电气股份有限公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n </tbody>\n</table>\n</div>"
},
"execution_count": 21,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_df[(units_df['电厂名称']=='国能浙江北仑第一发电有限公司')&(units_df['机组编号']==7)&(units_df['铭牌容量 (MW)']==1000.0)]"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 22,
"outputs": [],
"source": [
"drop_units = units_df[(units_df['电厂名称']=='国能浙江北仑第一发电有限公司')&(units_df['机组编号']==7)&(units_df['铭牌容量 (MW)']==1000.0)].index.values\n",
"units_df.drop(index=drop_units, inplace=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 23,
"outputs": [
{
"data": {
"text/plain": " 企业编码 电厂名称 简称 机组编号 铭牌容量 (MW) 投产时间 机组类型 参数分类 \\\n1891 33008 国能浙江北仑第一发电有限公司 国家能源浙江北仑 7 1050.0 2009-6-2 纯凝式 超超临界 \n\n 所处地区 机组产地 锅炉制造厂家 汽轮机制造厂家 发电机制造厂家 主变压器制造厂家 \\\n1891 浙江省 国产 东方锅炉厂(东锅) 上海汽轮机厂(上汽) 上海电机厂(上电) 保定天威保变电气股份有限公司 \n\n 二级公司 所属集团 \n1891 北京国华电力有限责任公司 国家能源投资集团有限责任公司 ",
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>企业编码</th>\n <th>电厂名称</th>\n <th>简称</th>\n <th>机组编号</th>\n <th>铭牌容量 (MW)</th>\n <th>投产时间</th>\n <th>机组类型</th>\n <th>参数分类</th>\n <th>所处地区</th>\n <th>机组产地</th>\n <th>锅炉制造厂家</th>\n <th>汽轮机制造厂家</th>\n <th>发电机制造厂家</th>\n <th>主变压器制造厂家</th>\n <th>二级公司</th>\n <th>所属集团</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>1891</th>\n <td>33008</td>\n <td>国能浙江北仑第一发电有限公司</td>\n <td>国家能源浙江北仑</td>\n <td>7</td>\n <td>1050.0</td>\n <td>2009-6-2</td>\n <td>纯凝式</td>\n <td>超超临界</td>\n <td>浙江省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>上海汽轮机厂(上汽)</td>\n <td>上海电机厂(上电)</td>\n <td>保定天威保变电气股份有限公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n </tbody>\n</table>\n</div>"
},
"execution_count": 23,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_df[(units_df['电厂名称']=='国能浙江北仑第一发电有限公司')&(units_df['机组编号']==7)]"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 24,
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"D:\\miniconda3\\envs\\py37\\lib\\site-packages\\ipykernel_launcher.py:1: FutureWarning: Dropping invalid columns in DataFrameGroupBy.max is deprecated. In a future version, a TypeError will be raised. Before calling .max, select only columns which should be valid for the function.\n",
" \"\"\"Entry point for launching an IPython kernel.\n"
]
}
],
"source": [
"units_max = units_df.groupby(['电厂名称', '机组编号', '投产时间']).max().reset_index()"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 25,
"outputs": [
{
"data": {
"text/plain": "(1926, 13)"
},
"execution_count": 25,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_max.shape"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 26,
"outputs": [
{
"data": {
"text/plain": " 电厂名称 机组编号 投产时间 企业编码 简称 铭牌容量 (MW) 机组类型 \\\n0 万方发电厂(焦作爱依斯万方电力有限公司) 1 1997-8-17 41020 河南焦作万方 125.0 纯凝式 \n1 万方发电厂(焦作爱依斯万方电力有限公司) 2 1998-7-8 41020 河南焦作万方 125.0 纯凝式 \n2 三河发电有限责任公司 1 1999-12-17 13032 国家能源河北三河 350.0 供热式 \n3 三河发电有限责任公司 2 2000-4-2 13032 国家能源河北三河 350.0 供热式 \n4 三河发电有限责任公司 3 2007-8-31 13032 国家能源河北三河 315.0 供热式 \n... ... ... ... ... ... ... ... \n1921 黔桂发电有限责任公司 1 1994-1-16 74009 金元贵州盘县 200.0 纯凝式 \n1922 黔桂发电有限责任公司 2 1994-10-26 74009 金元贵州盘县 200.0 纯凝式 \n1923 黔桂发电有限责任公司 3 1996-10-14 74009 金元贵州盘县 200.0 纯凝式 \n1924 黔桂发电有限责任公司 4 2001-4-9 74009 金元贵州盘县 200.0 纯凝式 \n1925 黔桂发电有限责任公司 5 2001-8-25 74009 金元贵州盘县 200.0 纯凝式 \n\n 参数分类 所处地区 机组产地 锅炉制造厂家 二级公司 所属集团 \n0 超高压 河南省 国产 上海锅炉厂(上锅) NaN 其他 \n1 超高压 河南省 国产 上海锅炉厂(上锅) NaN 其他 \n2 亚临界 河北省 进口 日本三菱公司 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n3 亚临界 河北省 进口 日本三菱公司 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n4 亚临界 河北省 国产 东方锅炉厂(东锅) 北京国华电力有限责任公司 国家能源投资集团有限责任公司 \n... ... ... ... ... ... ... \n1921 超高压 贵州省 国产 东方锅炉厂(东锅) 贵州金元电力投资股份有限公司 国家电力投资集团有限公司 \n1922 超高压 贵州省 国产 东方锅炉厂(东锅) 贵州金元电力投资股份有限公司 国家电力投资集团有限公司 \n1923 超高压 贵州省 国产 东方锅炉厂(东锅) 贵州金元电力投资股份有限公司 国家电力投资集团有限公司 \n1924 超高压 贵州省 国产 东方锅炉厂(东锅) 贵州金元电力投资股份有限公司 国家电力投资集团有限公司 \n1925 超高压 贵州省 国产 东方锅炉厂(东锅) 贵州金元电力投资股份有限公司 国家电力投资集团有限公司 \n\n[1926 rows x 13 columns]",
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>电厂名称</th>\n <th>机组编号</th>\n <th>投产时间</th>\n <th>企业编码</th>\n <th>简称</th>\n <th>铭牌容量 (MW)</th>\n <th>机组类型</th>\n <th>参数分类</th>\n <th>所处地区</th>\n <th>机组产地</th>\n <th>锅炉制造厂家</th>\n <th>二级公司</th>\n <th>所属集团</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>0</th>\n <td>万方发电厂(焦作爱依斯万方电力有限公司)</td>\n <td>1</td>\n <td>1997-8-17</td>\n <td>41020</td>\n <td>河南焦作万方</td>\n <td>125.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>河南省</td>\n <td>国产</td>\n <td>上海锅炉厂(上锅)</td>\n <td>NaN</td>\n <td>其他</td>\n </tr>\n <tr>\n <th>1</th>\n <td>万方发电厂(焦作爱依斯万方电力有限公司)</td>\n <td>2</td>\n <td>1998-7-8</td>\n <td>41020</td>\n <td>河南焦作万方</td>\n <td>125.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>河南省</td>\n <td>国产</td>\n <td>上海锅炉厂(上锅)</td>\n <td>NaN</td>\n <td>其他</td>\n </tr>\n <tr>\n <th>2</th>\n <td>三河发电有限责任公司</td>\n <td>1</td>\n <td>1999-12-17</td>\n <td>13032</td>\n <td>国家能源河北三河</td>\n <td>350.0</td>\n <td>供热式</td>\n <td>亚临界</td>\n <td>河北省</td>\n <td>进口</td>\n <td>日本三菱公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>3</th>\n <td>三河发电有限责任公司</td>\n <td>2</td>\n <td>2000-4-2</td>\n <td>13032</td>\n <td>国家能源河北三河</td>\n <td>350.0</td>\n <td>供热式</td>\n <td>亚临界</td>\n <td>河北省</td>\n <td>进口</td>\n <td>日本三菱公司</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>4</th>\n <td>三河发电有限责任公司</td>\n <td>3</td>\n <td>2007-8-31</td>\n <td>13032</td>\n <td>国家能源河北三河</td>\n <td>315.0</td>\n <td>供热式</td>\n <td>亚临界</td>\n <td>河北省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>北京国华电力有限责任公司</td>\n <td>国家能源投资集团有限责任公司</td>\n </tr>\n <tr>\n <th>...</th>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n <td>...</td>\n </tr>\n <tr>\n <th>1921</th>\n <td>黔桂发电有限责任公司</td>\n <td>1</td>\n <td>1994-1-16</td>\n <td>74009</td>\n <td>金元贵州盘县</td>\n <td>200.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>贵州省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>贵州金元电力投资股份有限公司</td>\n <td>国家电力投资集团有限公司</td>\n </tr>\n <tr>\n <th>1922</th>\n <td>黔桂发电有限责任公司</td>\n <td>2</td>\n <td>1994-10-26</td>\n <td>74009</td>\n <td>金元贵州盘县</td>\n <td>200.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>贵州省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>贵州金元电力投资股份有限公司</td>\n <td>国家电力投资集团有限公司</td>\n </tr>\n <tr>\n <th>1923</th>\n <td>黔桂发电有限责任公司</td>\n <td>3</td>\n <td>1996-10-14</td>\n <td>74009</td>\n <td>金元贵州盘县</td>\n <td>200.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>贵州省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>贵州金元电力投资股份有限公司</td>\n <td>国家电力投资集团有限公司</td>\n </tr>\n <tr>\n <th>1924</th>\n <td>黔桂发电有限责任公司</td>\n <td>4</td>\n <td>2001-4-9</td>\n <td>74009</td>\n <td>金元贵州盘县</td>\n <td>200.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>贵州省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>贵州金元电力投资股份有限公司</td>\n <td>国家电力投资集团有限公司</td>\n </tr>\n <tr>\n <th>1925</th>\n <td>黔桂发电有限责任公司</td>\n <td>5</td>\n <td>2001-8-25</td>\n <td>74009</td>\n <td>金元贵州盘县</td>\n <td>200.0</td>\n <td>纯凝式</td>\n <td>超高压</td>\n <td>贵州省</td>\n <td>国产</td>\n <td>东方锅炉厂(东锅)</td>\n <td>贵州金元电力投资股份有限公司</td>\n <td>国家电力投资集团有限公司</td>\n </tr>\n </tbody>\n</table>\n<p>1926 rows × 13 columns</p>\n</div>"
},
"execution_count": 26,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"units_max"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "markdown",
"source": [
"### 汽轮机数据"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%% md\n"
}
}
},
{
"cell_type": "code",
"execution_count": 27,
"outputs": [
{
"data": {
"text/plain": "['中国中信集团公司-32020-汽轮机数据查询-20230313.xls',\n '中国中煤能源集团有限公司-34027-汽轮机数据查询-20230313.xls',\n '中国华电集团有限公司-21060-汽轮机数据查询-20230313.xls',\n '中国华能集团有限公司-17021-汽轮机数据查询-20230313.xls',\n '中国大唐集团有限公司-61005-汽轮机数据查询-20230313.xls',\n '中国铝业股份有限公司-64011-汽轮机数据查询-20230313.xls',\n '中国长江三峡集团公司-42011-汽轮机数据查询-20230313.xls',\n '其他-47001-汽轮机数据查询-20230313.xls',\n '内蒙古源源能源集团有限责任公司-15050-汽轮机数据查询-20230313.xls',\n '内蒙古能源发电投资集团有限公司-15047-汽轮机数据查询-20230313.xls',\n '北京能源集团有限责任公司-64009-汽轮机数据查询-20230313.xls',\n '华润(集团)有限公司-13008-汽轮机数据查询-20230313.xls',\n '协鑫集团有限公司-32036-汽轮机数据查询-20230313.xls',\n '国家开发投资公司-37009-汽轮机数据查询-20230313.xls',\n '国家开发投资集团有限公司-16014-汽轮机数据查询-20230313.xls',\n '国家电力投资集团有限公司-21018-汽轮机数据查询-20230313.xls',\n '国家能源投资集团有限责任公司-23012-汽轮机数据查询-20230313.xls',\n '安徽省能源集团有限公司-34003-汽轮机数据查询-20230313.xls',\n '山西国际能源集团有限公司-14088-汽轮机数据查询-20230313.xls',\n '山西焦煤集团有限公司-14099-汽轮机数据查询-20230313.xls',\n '广东省能源集团有限公司-71003-汽轮机数据查询-20230313.xls',\n '广州发展集团股份有限公司-71021-汽轮机数据查询-20230313.xls',\n '新疆天山电力股份有限公司-65004-汽轮机数据查询-20230313.xls',\n '晋能控股电力集团-14022-汽轮机数据查询-20230313.xls',\n '江苏省国信集团有限公司-32015-汽轮机数据查询-20230313.xls',\n '江西省投资集团有限公司-44020-汽轮机数据查询-20230313.xls',\n '河北建设投资集团有限责任公司-13056-汽轮机数据查询-20230313.xls',\n '河南投资集团有限公司-41014-汽轮机数据查询-20230313.xls',\n '浙江省能源集团有限公司-33001-汽轮机数据查询-20230313.xls',\n '深圳能源集团股份有限公司-71022-汽轮机数据查询-20230313.xls',\n '甘肃省电力投资集团有限责任公司-62006-汽轮机数据查询-20230313.xls',\n '申能股份有限公司-35016-汽轮机数据查询-20230313.xls',\n '陕西投资集团有限公司-61040-汽轮机数据查询-20230313.xls',\n '陕西榆林能源集团有限公司-61041-汽轮机数据查询-20230313.xls',\n '陕西煤业化工集团有限责任公司-43014-汽轮机数据查询-20230313.xls']"
},
"execution_count": 27,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"old_steam = [x for x in os.listdir('./new_data/') if '汽轮机' in x]\n",
"steam_data = [x for x in os.listdir('./火电20230313/火电20230313/') if '汽轮机' in x]\n",
"steam_data"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 28,
"outputs": [
{
"data": {
"text/plain": "['序号',\n '企业编码',\n '电厂名称',\n '简称',\n '机组编号',\n '制造厂家',\n '型号',\n '出厂编号',\n '出厂编号',\n '汽轮机缸效率高压缸(%',\n '汽轮机缸效率中压缸(%',\n '汽轮机缸效率低压缸(%',\n '最大连续出力T-MCRMW',\n '额定主蒸汽压力MPa',\n '额定主蒸汽温度(℃)',\n '额定再热汽温度(℃)',\n '设计给水温度(℃)',\n '凝汽式机组保证热耗率kJ/kWh',\n '凝汽式汽机设计背压kPa',\n '供热式机组保证热耗率额定供热工况kJ/kWh',\n '供热式机组保证热耗率纯凝工况kJ/kWh',\n '供热式汽机设计背压供热工况kPa',\n '供热式汽机设计背压纯凝工况kPa',\n '设计供热抽汽压力工业MPa',\n '设计供热抽汽压力采暖MPa',\n '设计供热抽汽温度工业(℃)',\n '设计供热抽汽温度采暖(℃)',\n '设计最大供热抽汽流量工业t/h',\n '设计最大供热抽汽流量采暖t/h',\n '凝结水泵制造厂家',\n '凝结水泵型号',\n '凝结水泵电机电压V',\n '凝结水泵电机功率kW',\n '凝结水泵凝结水泵流量t/h',\n '循环水泵制造厂家',\n '循环水泵型号',\n '循环水泵电机电压V',\n '循环水泵电机功率kW',\n '循环水泵循环水泵流量t/h',\n '给水泵汽轮机制造厂',\n '给水泵汽轮机型号',\n '给水泵汽轮机出力比(%)',\n '给水泵汽轮机台数(台)',\n '给水泵汽轮机额定功率KW',\n '给水泵汽轮机内效率(%)',\n '给水泵汽轮机额定进汽压力MPa',\n '给水泵汽轮机额定排汽压力kPa',\n '给水泵汽轮机额定进汽温度(℃)',\n '给水泵汽轮机额定排汽温度(℃)',\n '给水泵汽轮机额定蒸汽流量t/h',\n '电动给水泵制造厂',\n '电动给水泵型号',\n '电动给水泵出力比(%',\n '电动给水泵台数(台)',\n '电动给水泵给水泵流量t/h',\n '电动给水泵给水泵压力MPa',\n '旁路系统型式',\n '旁路系统旁路蒸汽量比率(%',\n '冷凝器制造厂家',\n '冷凝器型号',\n '冷凝器型式',\n '循环水介质及比例地表水(%',\n '循环水介质及比例地下水(%',\n '循环水介质及比例中水(%',\n '循环水介质及比例海水(%',\n '循环水循环方式',\n '循环冷却倍率(%',\n '开式循环水提升高度m',\n '空冷机组出力受阻背压kPa',\n '空冷机组出力受阻背压kPa.1']"
},
"execution_count": 28,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"steam_samples = pd.read_excel(f'./new_data/{old_steam[0]}', header=[3,4,5])\n",
"steam_cols = [''.join([x for x in y if 'Unnamed' not in x]) for y in steam_samples.columns]\n",
"steam_cols"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 29,
"outputs": [],
"source": [
"steam_list = list()\n",
"for file in old_steam:\n",
" data = pd.read_excel(f'./new_data/{file}', header=[3, 4, 5])\n",
" data.columns = steam_cols\n",
" steam_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 30,
"outputs": [],
"source": [
"# unit_list = list()\n",
"for file in steam_data:\n",
" data = pd.read_excel(f'./火电20230313/火电20230313/{file}', header=[3,4,5])\n",
" data.columns = steam_cols\n",
" steam_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 31,
"outputs": [],
"source": [
"steam_df = pd.concat(steam_list).drop(columns=['序号', '空冷机组出力受阻背压kPa.1']).drop_duplicates().reset_index(drop=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 32,
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"D:\\miniconda3\\envs\\py37\\lib\\site-packages\\ipykernel_launcher.py:1: FutureWarning: Dropping invalid columns in DataFrameGroupBy.max is deprecated. In a future version, a TypeError will be raised. Before calling .max, select only columns which should be valid for the function.\n",
" \"\"\"Entry point for launching an IPython kernel.\n"
]
}
],
"source": [
"steam_max = steam_df.groupby(['电厂名称', '机组编号']).max().reset_index()"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "markdown",
"source": [
"### 锅炉数据"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%% md\n"
}
}
},
{
"cell_type": "code",
"execution_count": 33,
"outputs": [
{
"data": {
"text/plain": "['中国中信集团公司-32020-锅炉数据查询-20230313.xls',\n '中国中煤能源集团有限公司-34027-锅炉数据查询-20230313.xls',\n '中国华电集团有限公司-21060-锅炉数据查询-20230313.xls',\n '中国华能集团有限公司-17021-锅炉数据查询-20230313.xls',\n '中国大唐集团有限公司-61005-锅炉数据查询-20230313.xls',\n '中国铝业股份有限公司-64011-锅炉数据查询-20230313.xls',\n '中国长江三峡集团公司-42011-锅炉数据查询-20230313.xls',\n '其他-47001-锅炉数据查询-20230313.xls',\n '内蒙古源源能源集团有限责任公司-15050-锅炉数据查询-20230313.xls',\n '内蒙古能源发电投资集团有限公司-15047-锅炉数据查询-20230313.xls',\n '北京能源集团有限责任公司-64009-锅炉数据查询-20230313.xls',\n '华润(集团)有限公司-13008-锅炉数据查询-20230313.xls',\n '协鑫集团有限公司-32036-锅炉数据查询-20230313.xls',\n '国家开发投资公司-37009-锅炉数据查询-20230313.xls',\n '国家开发投资集团有限公司-16014-锅炉数据查询-20230313.xls',\n '国家电力投资集团有限公司-21018-锅炉数据查询-20230313.xls',\n '国家能源投资集团有限责任公司-23012-锅炉数据查询-20230313.xls',\n '安徽省能源集团有限公司-34003-锅炉数据查询-20230313.xls',\n '山西国际能源集团有限公司-14088-锅炉数据查询-20230313.xls',\n '山西焦煤集团有限公司-14099-锅炉数据查询-20230313.xls',\n '广东省能源集团有限公司-71003-锅炉数据查询-20230313.xls',\n '广州发展集团股份有限公司-71021-锅炉数据查询-20230313.xls',\n '新疆天山电力股份有限公司-65004-锅炉数据查询-20230313.xls',\n '晋能控股电力集团-14022-锅炉数据查询-20230313.xls',\n '江苏省国信集团有限公司-32015-锅炉数据查询-20230313.xls',\n '江西省投资集团有限公司-44020-锅炉数据查询-20230313.xls',\n '河北建设投资集团有限责任公司-13056-锅炉数据查询-20230313.xls',\n '河南投资集团有限公司-41014-锅炉数据查询-20230313.xls',\n '浙江省能源集团有限公司-33001-锅炉数据查询-20230313.xls',\n '深圳能源集团股份有限公司-71022-锅炉数据查询-20230313.xls',\n '甘肃省电力投资集团有限责任公司-62006-锅炉数据查询-20230313.xls',\n '申能股份有限公司-35016-锅炉数据查询-20230313.xls',\n '陕西投资集团有限公司-61040-锅炉数据查询-20230313.xls',\n '陕西榆林能源集团有限公司-61041-锅炉数据查询-20230313.xls',\n '陕西煤业化工集团有限责任公司-43014-锅炉数据查询-20230313.xls']"
},
"execution_count": 33,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"old_boiler = [x for x in os.listdir('./new_data/') if '锅炉' in x]\n",
"new_boiler = [x for x in os.listdir('./火电20230313/火电20230313/') if '锅炉' in x]\n",
"new_boiler"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 34,
"outputs": [
{
"data": {
"text/plain": "['序号',\n '企业编码',\n '电厂名称',\n '简称',\n '机组编号',\n '制造厂家',\n '型号',\n '型式',\n '最大连续出力B-MCR(t/h)',\n '设计效率(%)',\n '工质流动方式',\n ' 额定主蒸汽压力 (MPa)',\n '额再热蒸汽温度 (℃)',\n '额定再热蒸汽压力 (MPa)',\n ' 额再热蒸汽温度 (℃)',\n '额再热蒸汽温度 (℃).1',\n '点火方式',\n '燃烧方式',\n '设计燃煤种类',\n '设计燃煤灰份(收到基)(%)',\n '设计燃煤挥发份)(收到基)(%)',\n '设计燃煤低位热值收到基kJ/kg',\n '排渣方式',\n '除灰方式',\n '空预器制造厂家',\n '空预器型号',\n '空预器型式',\n '空预器设计漏风率(%)',\n '磨煤机制造厂家',\n '磨煤机型号',\n '磨煤机型式',\n '磨煤机出力比',\n '磨煤机总台数',\n '磨煤机制粉方式',\n '除尘器制造厂家',\n '除尘器型号',\n '除尘器型式',\n '除尘器除尘器设计效率(%)',\n '一次风机制造厂家',\n '一次风机型号',\n '一次风机型式',\n '一次风机最大风压(Pa)',\n '一次风机最大流量 (m3/S)',\n '一次风机电机电压(V)',\n '一次风机电机功率(KW)',\n '送风机制造厂家',\n '送风机型号',\n '送风机型式',\n '送风机最大风压(Pa)',\n '送风机 最大流量m3/S',\n '送风机电机电压V',\n '送风机电机功率KW',\n '引风机制造厂家',\n '引风机型号',\n '引风机型式',\n '引风机最大风压(Pa)',\n '引风机最大流量(m3/S',\n '引风机电机电压(V)',\n '引风机电机功率KW',\n '引风机电机功率KW.1']"
},
"execution_count": 34,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"boiler_samples = pd.read_excel(f'./new_data/{old_boiler[0]}', header=[3,4])\n",
"boiler_cols = [''.join([x for x in y if 'Unnamed' not in x]) for y in boiler_samples.columns]\n",
"boiler_cols"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 35,
"outputs": [],
"source": [
"boiler_list = list()\n",
"for file in old_boiler:\n",
" data = pd.read_excel(f'./new_data/{file}', header=[3, 4])\n",
" data.columns = boiler_cols\n",
" boiler_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 36,
"outputs": [],
"source": [
"for file in new_boiler:\n",
" data = pd.read_excel(f'./火电20230313/火电20230313/{file}', header=[3,4])\n",
" data.columns = boiler_cols\n",
" boiler_list.append(data)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 37,
"outputs": [],
"source": [
"boiler_df = pd.concat(boiler_list).drop(columns=['序号', '引风机电机功率KW.1']).drop_duplicates().reset_index(drop=True)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 38,
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"D:\\miniconda3\\envs\\py37\\lib\\site-packages\\ipykernel_launcher.py:1: FutureWarning: Dropping invalid columns in DataFrameGroupBy.max is deprecated. In a future version, a TypeError will be raised. Before calling .max, select only columns which should be valid for the function.\n",
" \"\"\"Entry point for launching an IPython kernel.\n"
]
}
],
"source": [
"boiler_max = boiler_df.groupby(['电厂名称', '机组编号']).max().reset_index()"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 39,
"outputs": [],
"source": [
"use_unit = units_df[units_df.columns[[1,3,4,5,6,7,8]]].drop_duplicates().set_index(['电厂名称', '机组编号'])\n",
"use_run_data = run_data_max.set_index(['电厂名称', '机组编号'])\n",
"use_steam = steam_df[steam_df.columns[[1,3,-9]]].drop_duplicates().set_index(['电厂名称', '机组编号'])\n",
"use_boiler = boiler_df.drop_duplicates().set_index(['电厂名称', '机组编号'])"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 40,
"outputs": [],
"source": [
"total_data = use_unit.merge(use_steam, how='left', on=['电厂名称', '机组编号'])"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 41,
"outputs": [],
"source": [
"total_data = total_data.merge(use_run_data, how='left', on=['电厂名称', '机组编号'])"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 42,
"outputs": [],
"source": [
"total_data = total_data.merge(use_boiler, how='left', on=['电厂名称', '机组编号'])"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": 43,
"outputs": [],
"source": [
"total_data.reset_index().to_excel('./total_data.xlsx', index=False)"
],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
},
{
"cell_type": "code",
"execution_count": null,
"outputs": [],
"source": [],
"metadata": {
"collapsed": false,
"pycharm": {
"name": "#%%\n"
}
}
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.13"
}
},
"nbformat": 4,
"nbformat_minor": 4
}