# install.packages("dplyr")
library(dplyr)
					
# Dispersão
df_temp_vs_visualiz = df_clima_consolidado %>% 
  filter(mes %in% c("06", "07", "08", "09")) %>%
  group_by (cidade) %>%
  summarise(media_temperaturas = 
              mean(as.numeric(history.observations.tempm)), 
            quantas = n()) %>%
  arrange (desc(quantas)) %>%
  head (10)

quantidades = 	df_temp_vs_visualiz$quantas
temperaturas = df_temp_vs_visualiz$media_temperaturas

plot(quantidades, temperaturas, 
     main="Relação Visualizações com Temperatura Média no Verão", 
     xlab="Visualizações ", 
     ylab="Temperatura Média no Verão", 
     pch=19)

cidades=df_temp_vs_visualiz$cidade
text(quantidades, temperaturas, labels=cidades, cex= 0.7, pos=2)

# Linha

ncol(df_clima_consolidado)
df_clima_consolidado = df_clima_consolidado %>% 
  mutate(anomes = as.numeric(ano) * 100 + as.numeric (mes))

ncol(df_clima_consolidado)

df_Phoenix_vs_visualiz = df_clima_consolidado %>% 
  filter(cidade == "Phoenix") %>%
  group_by (anomes) %>%
  summarise(quantas = n()) %>%
  arrange (anomes) 

df_clima_consolidado$anomes = NULL

df_Phoenix_vs_visualiz = df_clima_consolidado %>% 
  filter(cidade == "Phoenix") %>%
  group_by (ano) %>%
  summarise(quantas = n()) %>%
  arrange (ano)

# install.packages("ggplot2")
library(ggplot2)

ggplot(data=df_Phoenix_vs_visualiz, aes(x=ano, y=quantas, group=1)) + geom_line()+ geom_point()

# Barras verticais
df_Compara_Arizona_California = df_clima_consolidado %>% 
  filter(estado %in% c("CA", "AZ")) %>%
  filter (as.numeric(ano) >= 2012) %>%
  group_by (estado, ano) %>%
  summarise(quantas = n()) %>%
  arrange (ano)


ggplot(df_Compara_Arizona_California, 
       aes(estado, quantas, colour=ano))+ 
    geom_bar(aes(fill = ano), 
    position = "dodge", stat="identity")
#ou
ggplot(df_Compara_Arizona_California, 
       aes(ano, quantas, colour=estado))+ 
  geom_bar(aes(fill = estado), 
  position = "dodge", stat="identity")+
  coord_flip()

# Barras empilhadas

# install.packages('sqldf')
require(sqldf)
OVNI_EUA_por_Tipo = 
    sqldf("select estado, formato, count(*) Quantas  
          from df_clima_consolidado 
          where estado in ('CA', 'FL', 'WA', 'TX')
          and formato in ('Light', 'Circle', 'Fireball', 'Sphere')
          group by estado, formato
          order by 3 desc")

ggplot(OVNI_EUA_por_Tipo, aes(x = estado, y = Quantas)) +
  geom_col(aes(fill = formato))



