{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": { "collapsed": false, "jupyter": { "outputs_hidden": false }, "pycharm": { "name": "#%%\n" } }, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "import xgboost as xgb\n", "import seaborn as sns\n", "from sklearn.model_selection import train_test_split" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "collapsed": false, "jupyter": { "outputs_hidden": false }, "pycharm": { "name": "#%%\n" } }, "outputs": [ { "data": { "text/html": [ "
\n", " | 所处地区 | \n", "机组类型 | \n", "参数分类 | \n", "冷凝器型式 | \n", "铭牌容量 (MW) | \n", "longitude | \n", "latitude | \n", "altitude | \n", "power_co2_factor | \n", "heat_co2_factor | \n", "
---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "上海市 | \n", "供热式 | \n", "亚临界 | \n", "水冷 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.574332 | \n", "0.072680 | \n", "
1 | \n", "上海市 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.582164 | \n", "0.072391 | \n", "
2 | \n", "上海市 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "4.808939 | \n", "3.476886 | \n", "1.098612 | \n", "0.569281 | \n", "0.071041 | \n", "
3 | \n", "上海市 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "4.807356 | \n", "3.458373 | \n", "1.609438 | \n", "0.506250 | \n", "0.070460 | \n", "
4 | \n", "上海市 | \n", "纯凝式 | \n", "亚临界 | \n", "水冷 | \n", "5.860786 | \n", "4.807839 | \n", "3.478627 | \n", "2.833213 | \n", "0.565226 | \n", "0.073717 | \n", "
\n", " | 所处地区 | \n", "机组类型 | \n", "参数分类 | \n", "冷凝器型式 | \n", "铭牌容量 (MW) | \n", "longitude | \n", "latitude | \n", "altitude | \n", "
---|---|---|---|---|---|---|---|---|
0 | \n", "安徽省 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "
1 | \n", "安徽省 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "
2 | \n", "安徽省 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "
3 | \n", "安徽省 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "
4 | \n", "安徽省 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.713572 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
5090 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.912023 | \n", "3.427489 | \n", "4.682353 | \n", "5.645447 | \n", "
5091 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "
5092 | \n", "重庆市 | \n", "抽背式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "
5093 | \n", "重庆市 | \n", "背压式 | \n", "高压 | \n", "其他 | \n", "3.433987 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "
5094 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "4.836282 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "
5095 rows × 8 columns
\n", "\n", " | 所处地区 | \n", "机组类型 | \n", "参数分类 | \n", "冷凝器型式 | \n", "铭牌容量 (MW) | \n", "longitude | \n", "latitude | \n", "altitude | \n", "power_co2_factor | \n", "heat_co2_factor | \n", "
---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "上海市 | \n", "供热式 | \n", "亚临界 | \n", "水冷 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.574332 | \n", "0.072680 | \n", "
1 | \n", "上海市 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.582164 | \n", "0.072391 | \n", "
2 | \n", "上海市 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "4.808939 | \n", "3.476886 | \n", "1.098612 | \n", "0.569281 | \n", "0.071041 | \n", "
3 | \n", "上海市 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "4.807356 | \n", "3.458373 | \n", "1.609438 | \n", "0.506250 | \n", "0.070460 | \n", "
4 | \n", "上海市 | \n", "纯凝式 | \n", "亚临界 | \n", "水冷 | \n", "5.860786 | \n", "4.807839 | \n", "3.478627 | \n", "2.833213 | \n", "0.565226 | \n", "0.073717 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
5090 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.912023 | \n", "3.427489 | \n", "4.682353 | \n", "5.645447 | \n", "NaN | \n", "NaN | \n", "
5091 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "NaN | \n", "NaN | \n", "
5092 | \n", "重庆市 | \n", "抽背式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "NaN | \n", "NaN | \n", "
5093 | \n", "重庆市 | \n", "背压式 | \n", "高压 | \n", "其他 | \n", "3.433987 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "NaN | \n", "NaN | \n", "
5094 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "4.836282 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "NaN | \n", "NaN | \n", "
5619 rows × 10 columns
\n", "\n", " | 铭牌容量 (MW) | \n", "longitude | \n", "latitude | \n", "altitude | \n", "power_co2_factor | \n", "heat_co2_factor | \n", "所处地区_上海市 | \n", "所处地区_云南省 | \n", "所处地区_内蒙古 | \n", "所处地区_内蒙古自治区 | \n", "... | \n", "机组类型_背压式 | \n", "参数分类_中压 | \n", "参数分类_亚临界 | \n", "参数分类_超临界 | \n", "参数分类_超超临界 | \n", "参数分类_超高压 | \n", "参数分类_高压 | \n", "冷凝器型式_其他 | \n", "冷凝器型式_水冷 | \n", "冷凝器型式_空冷 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.574332 | \n", "0.072680 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
1 | \n", "5.707110 | \n", "4.807875 | \n", "3.467769 | \n", "1.386294 | \n", "0.582164 | \n", "0.072391 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
2 | \n", "5.771441 | \n", "4.808939 | \n", "3.476886 | \n", "1.098612 | \n", "0.569281 | \n", "0.071041 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
3 | \n", "6.908755 | \n", "4.807356 | \n", "3.458373 | \n", "1.609438 | \n", "0.506250 | \n", "0.070460 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
4 | \n", "5.860786 | \n", "4.807839 | \n", "3.478627 | \n", "2.833213 | \n", "0.565226 | \n", "0.073717 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
5090 | \n", "3.912023 | \n", "3.427489 | \n", "4.682353 | \n", "5.645447 | \n", "NaN | \n", "NaN | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
5091 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "NaN | \n", "NaN | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
5092 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "NaN | \n", "NaN | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
5093 | \n", "3.433987 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "NaN | \n", "NaN | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "0 | \n", "0 | \n", "
5094 | \n", "4.836282 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "NaN | \n", "NaN | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
5619 rows × 63 columns
\n", "\n", " | 所处地区 | \n", "机组类型 | \n", "参数分类 | \n", "冷凝器型式 | \n", "铭牌容量 (MW) | \n", "longitude | \n", "latitude | \n", "altitude | \n", "prediction | \n", "power_co2_factor | \n", "
---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "安徽省 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "0.563267 | \n", "0.513529 | \n", "
1 | \n", "安徽省 | \n", "凝气式 | \n", "亚临界 | \n", "水冷 | \n", "5.771441 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "0.563267 | \n", "0.513529 | \n", "
2 | \n", "安徽省 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "0.558872 | \n", "0.478943 | \n", "
3 | \n", "安徽省 | \n", "凝气式 | \n", "超超临界 | \n", "水冷 | \n", "6.908755 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "0.558872 | \n", "0.478943 | \n", "
4 | \n", "安徽省 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.713572 | \n", "3.451583 | \n", "4.772094 | \n", "2.397895 | \n", "0.563501 | \n", "0.510681 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
5090 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.912023 | \n", "3.427489 | \n", "4.682353 | \n", "5.645447 | \n", "0.562492 | \n", "0.512501 | \n", "
5091 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "0.562492 | \n", "0.512513 | \n", "
5092 | \n", "重庆市 | \n", "抽背式 | \n", "高压 | \n", "水冷 | \n", "3.258097 | \n", "3.427666 | \n", "4.682306 | \n", "5.627621 | \n", "0.562597 | \n", "0.514091 | \n", "
5093 | \n", "重庆市 | \n", "背压式 | \n", "高压 | \n", "其他 | \n", "3.433987 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "0.560515 | \n", "0.509951 | \n", "
5094 | \n", "重庆市 | \n", "抽凝式 | \n", "高压 | \n", "水冷 | \n", "4.836282 | \n", "3.428715 | \n", "4.682208 | \n", "5.690359 | \n", "0.561920 | \n", "0.511886 | \n", "
5095 rows × 10 columns
\n", "\n", " | 省份 | \n", "CO2排放强度(kg/MJ) | \n", "
---|---|---|
0 | \n", "安徽 | \n", "0.224686 | \n", "
1 | \n", "安徽 | \n", "0.198733 | \n", "
2 | \n", "安徽 | \n", "0.198733 | \n", "
3 | \n", "安徽 | \n", "0.224686 | \n", "
4 | \n", "安徽 | \n", "0.224686 | \n", "
... | \n", "... | \n", "... | \n", "
848 | \n", "新疆 | \n", "0.196452 | \n", "
849 | \n", "辽宁 | \n", "0.185688 | \n", "
850 | \n", "内蒙古 | \n", "0.181214 | \n", "
851 | \n", "山东 | \n", "0.347570 | \n", "
852 | \n", "浙江 | \n", "0.251777 | \n", "
3156 rows × 2 columns
\n", "