-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathTD_rte_dplyr.R
140 lines (91 loc) · 3.48 KB
/
TD_rte_dplyr.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
library(dplyr)
library(antaresRead)
setSimulationPath()
areas <- readAntares() # equivalent to readAntares(areas="all")
links <- readAntares(links="all")
save(areas,links, file="TD_RTE.Rdata")
load("TD_RTE.Rdata")
base %>% select(`ma variable`)
# visualiser la base, en afficher les statistiques descriptives ====
View(areas)
summary(areas)
# afficher le nom des variables ====
names(areas)
# combien y a til de lignes ? =====
nrow(areas)
dim(areas)
# calculer pour chaque area le MRG price moyen ====
areas %>%
group_by(area) %>%
summarise(prix_moyen=mean(`MRG. PRICE`,na.rm=TRUE))
# calculer pour chaque area a chauqe tranche horainre le MRG price moyen ====
areas %>%
group_by(area,hour) %>%
summarise(prix_moyen=mean(`MRG. PRICE`))
# calculer pour chaque area a chaque heure la moyenne de tous les maximum ====
areas %>% group_by(area,hour) %>%
summarise_each(funs(mean),ends_with("max"))
areas %>% group_by(area,hour) %>%
summarise_each(funs(mean),contains("max",ignore.case = TRUE))
areas %>%
group_by(area,hour) %>%
select(contains("max")) %>%
summarise_each(funs(mean))
# construire le tableau qui représente la moyenne des prix avec une ligne par ====
#area et une colonne par horaire ====
library(reshape2)
areas %>%
dcast(area ~ hour,value.var = "MRG. PRICE",fun.aggregate=mean)
areas %>% group_by(area,hour) %>%
summarise(MOY= mean(`MRG. PRICE`)) %>%
dcast(area~hour)
areas %>% group_by(area,hour) %>%
summarise(MOY= mean(`MRG. PRICE`)) %>%
spread(area,hour)# a verifier.
# ne selectionner que l'area a dans areas====
areas2 <- areas %>% filter(area=="a")
areas2b <- areas[area=="a",]
# supprimer la colonne area ====
areas3 <- areas2 %>% select(-area)
# ne garder que les colonnes de cout et de prix et d'emission de CO2 ====
areas4 <- areas3 %>% select(contains("COST",ignore.case=TRUE),
contains("PRICE",ignore.case=TRUE),`CO2 EMIS.`)
# rajouter une colonne qui correspon au ratio de CO2 EMIS. par PRICE MRG.====
# Arrondir le résulat a 2 chiffres apres la virgule ====
areas5 <- areas4 %>% mutate(ratio =`CO2 EMIS.`/`MRG. PRICE`,
ratio=round(ratio,2))
# changer le nom de la colonne CO2 EMIS. par "emission_co2 ====
areas6 <-rename(areas5,emission_co2=`CO2 EMIS.`)
# exporter le resultat en CSV====
write.csv2(areas6,file="out.csv",row.names = FALSE)
browseURL("out.csv")
# tout faire en une seule instruction=====
areas %>%
filter(area=="a") %>%
select(-area) %>%
select(contains("COST",ignore.case=TRUE),
contains("PRICE",ignore.case=TRUE),
`CO2 EMIS.`) %>%
mutate(ratio =`CO2 EMIS.`/`MRG. PRICE`,
ratio=round(ratio,2)) %>%
arrange(ratio) %>%
rename(emission_co2 = `CO2 EMIS.`) %>%
write.csv2(file="out.csv",row.names=FALSE)
browseURL("out.csv")
areas %>% group_by(area) %>% summarise(nombre=n())
areas %>% group_by(area) %>% tally()
areas %>% count(area)
areas %>% count()
# microbenchmark::microbenchmark(nrow(areas),count(areas))
areas %>% distinct(area,.keep_all = TRUE)
areas %>% distinct(area,.keep_all = FALSE)
areas %>% distinct(area)
areas
areas %>% sample_n(10)
base[1:70,]
areas %>% slice(1:10)
apprentissage <- areas %>% sample_frac(0.7)
areas %>% anti_join(apprentissage) -> validation
dim(apprentissage)+dim(validation)
dim(areas)
#areas %>% group_by(area) %>% mutate() %>% ungroup() %>% arrange