import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 8, 66, 78]
y = [4, 1, 3, 2, 12, 25, 44]
plt.title("Comparativo entre valores dos eixos X e Y - Linha")
plt.xlabel("Dados do eixo X")
plt.ylabel("Dados do eixo Y")
plt.gcf().set_size_inches(16, 8)
plt.plot(x, y)
plt.show()
barX = [1, 2, 3, 4]
barY = [4, 1.5, 3, 2]
plt.title("Comparativo entre valores dos eixos X e Y - Barra")
plt.xlabel("Dados do eixo X")
plt.ylabel("Dados do eixo Y")
plt.gcf().set_size_inches(16, 8)
plt.bar(barX, barY)
plt.show()
barX_1 = [1, 2, 3, 4]
barY_1 = [4, 1.5, 3, 2]
barX_2 = [1, 2, 3, 4]
barY_2 = [1, 1, 2, 1]
plt.title("Comparativo entre valores dos eixos X e Y - Barra Comparada")
plt.xlabel("Dados do eixo X")
plt.ylabel("Dados do eixo Y")
plt.bar(barX_1, barY_1, label = "Grupo 1")
plt.bar(barX_2, barY_2, label = "Grupo 2")
plt.legend()
plt.gcf().set_size_inches(16, 8)
plt.show()
x = [1, 2, 3, 4, 5]
y = [5, 7, 1, 3, 0]
z = [100, 100, 100, 1000, 100]
plt.title("Comparativo entre valores dos eixos X e Y - Dispersão")
plt.xlabel("Dados do eixo X")
plt.ylabel("Dados do eixo Y")
plt.plot(x, y, color = "k", linestyle = ":")
plt.scatter(x, y, label = "Pontos no eixo X", color = "r", s = z, marker = "o")
plt.legend()
plt.gcf().set_size_inches(16, 8)
plt.show()
# Variável para definir o diretório do arquivo .csv
csvDiretorio = "dados/populacao-brasileira.csv"
# Leitura do arquivo .csv
dadosCsv = open(csvDiretorio).readlines()
# Define o delimitador do CSV
delimitador = ";"
# Exibir o nome das colunas
colunas = dadosCsv[0].split(delimitador)
print("Coluna 1: {} | Coluna 2: {}".format(colunas[0], colunas[1]))
# Tratamento do CSV extraindo ambas suas linhas e colunas
linha = []
coluna = []
for i in range(len(dadosCsv)):
if i != 0:
linhaCsv = dadosCsv[i].split(delimitador)
linha.append(int(linhaCsv[0]))
coluna.append(int(linhaCsv[1]))
# Visualizando os dados tratados do CSV
plt.title("Crescimento Anual da População Brasileira de 1980 a 2016")
plt.xlabel("Ano")
plt.ylabel("Crescimento Populacional")
plt.plot(linha, coluna, linestyle = "--", color = "k")
plt.bar(linha, coluna, color = "#e4e4e4")
plt.gcf().set_size_inches(16, 8)
plt.show()
# Importação da biblioteca Pandas e leitura do CSV em formato de um DataFrame(df)
import pandas as pd
dadosDf = pd.read_csv(csvDiretorio, delimiter = delimitador)
dadosDf.head(5)
ano = "ano"
population = "population"
# Visualizar os 5 maiores anos de crescimento
dadosDf.sort_values(by = population, ascending = False).head(5)
# Descrevendo dados estatísticos do DataFrame
dadosDf.describe()
# Criando a visualização com Pandas
plt.title("Crescimento Anual da População Brasileira de 1980 a 2016")
plt.xlabel("Ano")
plt.ylabel("Crescimento Populacional")
plt.plot(dadosDf[ano], dadosDf[population], linestyle = "--", color = "k")
plt.bar(dadosDf[ano], dadosDf[population], color = "#e4e4e4")
plt.gcf().set_size_inches(16, 8)
plt.show()
dadosDf2 = dadosDf.sort_values(by = population, ascending = True).head(10)
# Visualizando o top 10 com anos de maiores crescimentos
dadosDf2.plot.bar(x = ano, y = population, rot=0, figsize=(16, 8))
# Importando a biblioteca random para geração de números aleatórios
import random
dados = []
total = 100
for i in range(total):
numero_randomico = random.randint(0, total)
dados.append(numero_randomico)
plt.title("Diagrama de Caixa - Boxplot")
plt.boxplot(dados)
plt.gcf().set_size_inches(16, 8)
# Lê os dados de junção de pares de bases da bactéria e do humano
bacteria = open("dados/bacteria.fasta").read()
humano = open("dados/human.fasta").read()
nucleotideos = ['A', 'C', 'G', 'T']
contadorBacteria = {}
contadorHumano = {}
# Cria o dicionário de dados dos nucleotídeos
for i in nucleotideos:
for j in nucleotideos:
contadorBacteria[i + j] = 0
contadorHumano[i + j] = 0
print("Bacteria: {}".format(contadorBacteria))
print("Humano: {}".format(contadorHumano))
# Remove a quebra de linha do arquivo de entrada
bacteria = bacteria.replace("\n", "")
humano = humano.replace("\n", "")
# Define a contagem de cada par
# A cada vez que ocorrer um par deverá ser contado um valor
# Exemplo: AA: 153, AG: 78, TA: 44, TC: 48, ...
for k in range(len(bacteria) - 1):
contadorBacteria[bacteria[k] + entrada[k + 1]] += 1
for k in range(len(humano) - 1):
contadorHumano[humano[k] + humano[k + 1]] += 1
print("Bacteria: {}".format(contadorBacteria))
print("Humano: {}".format(contadorHumano))
# Define as colunas de nucleotideos das bactérias e as contagens
xbacteria = [i for i in contadorBacteria]
ybacteria = []
for i in contadorBacteria:
ybacteria.append(int(contadorBacteria[i]))
xhumano = [i for i in contadorHumano]
yhumano = []
for i in contadorHumano:
yhumano.append(int(contadorHumano[i]))
for i in range(len(xbacteria)):
print("Nucleotídeo: {} | Contagem Bactéria: {} | Contagem Humano: {}".format(xbacteria[i], str(ybacteria[i]), str(yhumano[i])))
# Visualização dos dados
plt.title("Contagens dos Nucleotídeos das Bactérias x Humanos")
plt.xlabel("Nucleotídeo")
plt.ylabel("Contagem")
plt.plot(xbacteria, ybacteria, color = "k", linestyle = "--", label = "Bactéria", marker = "x")
plt.plot(xhumano, yhumano, color = "r", linestyle = "--", label = "Humano", marker = "o")
plt.gcf().set_size_inches(16, 8)
plt.legend()
plt.show()
plt.title("Contagens dos Nucleotídeos das Bactérias x Humanos")
plt.xlabel("Nucleotídeo")
plt.ylabel("Contagem")
plt.plot(xbacteria, ybacteria, color = "r", linestyle = "--", label = "Bactéria", marker = "o")
plt.bar(xhumano, yhumano, color = "#e4e4e4", linestyle = "--", label = "Humano")
plt.gcf().set_size_inches(16, 8)
plt.legend()
plt.show()