1 svar
134 visningar
Soderstrom 2767
Postad: 19 mar 2022 20:40

Analys av datafil

Jag ska Beräkna årsvisa medelvärden och medianer och har kommit så långt. Jag vet inte hur jag ska fortsätta, tänker att jag ska använda "filterkommandon", men exakt hur, vet jag inte! :)

Datafilen (Temperaturdata)

Min kod
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import norm, t
import math
from sklearn import linear_model
import statsmodels.api as sm
from sklearn.model_selection import train_test_split 
from scipy import stats

df=pd.read_csv('SMHI.csv',sep=';', decimal=',')

df

df.head()

df.tail()

meanLufttemperatur = df['Lufttemperatur'].mean()
print(meanLufttemperatur)
5.9208525091524935


std_av11=math.sqrt((((df['Lufttemperatur'] - meanLufttemperatur)**2).sum())/(len(df['Lufttemperatur'])-1))
print(f'standardavvikelse  = {std_av11}')
standardavvikelse  = 8.933196325206683

medianLufttemperatur=df['Lufttemperatur'].median()
print(medianLufttemperatur)
5.6


JonV 42
Postad: 26 maj 2022 10:51

Titta på groupby() som finns in pandasbiblioteket. Med den kan du gruppera på året från datumkolumnen. Sedan kan du anropa .mean() eller .median() som du gjort innan. Då ska du få dina medelvärden och medianer för varje år.

Svara Avbryt
Close