import matplotlib.pyplot as plt
import pandas as pd

# Load dataset
df = pd.read_csv("datasets/data.csv")

# Select columns to plot
x = df["Kindly Rate your Sleep Quality 😴"]
y = df["How would you rate your stress levels?"]

# Plot bar chart
plt.bar(x, y)
plt.title("Sleep Quality vs Stress Levels")
plt.xlabel("Sleep Quality")
plt.ylabel("Stress Levels")
plt.show()

# Display dataset information
print("Dataset shape:", df.shape)
print(df.info())

Dataset shape: (53, 7)
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 53 entries, 0 to 52
Data columns (total 7 columns):
 #   Column                                                            Non-Null Count  Dtype 
---  ------                                                            --------------  ----- 
 0   Timestamp                                                         53 non-null     object
 1   Kindly Rate your Sleep Quality 😴                                  53 non-null     int64 
 2   How many times a week do you suffer headaches 🤕?                  53 non-null     int64 
 3   How would you rate you academic performance 👩‍🎓?                  53 non-null     int64 
 4   how would you rate your study load?                               53 non-null     int64 
 5   How many times a week you practice extracurricular activities 🎾?  53 non-null     int64 
 6   How would you rate your stress levels?                            53 non-null     int64 
dtypes: int64(6), object(1)
memory usage: 3.0+ KB
None

import pandas as pd
import matplotlib.pyplot as plt

# Load dataset

df = pd.read_csv("datasets/data.csv")

# Choose columns

x = df["Kindly Rate your Sleep Quality 😴"]
y = df["How would you rate your stress levels?"]
size = df["How many times a week do you suffer headaches 🤕?"] * 50  # scale bubble size

# Create bubble chart

plt.figure(figsize=(10,6))
scatter = plt.scatter(x, y, s=size, alpha=0.6, c=size, cmap='viridis', edgecolors='w', linewidth=0.5)

plt.title("Bubble Chart: Sleep Quality vs Stress Levels")
plt.xlabel("Sleep Quality")
plt.ylabel("Stress Levels")
plt.colorbar(scatter, label="Number of headaches per week")
plt.grid(True)
plt.show()

# %% [markdown]
# # Climate & Energy: Bubble Plots
# Daily Avg Temperature, Daily CO2 Emission, Yearly Energy Consumption

# %%
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_theme(style="whitegrid")
plt.rcParams["figure.figsize"] = (16,8)

# %%
# 1. Load dataset
df = pd.read_csv("datasets/climate.csv")

# Convert date to datetime
df['date'] = pd.to_datetime(df['date'])
df = df.sort_values('date')

# %%
# 2. Bubble plot: Daily Average Temperature
plt.figure(figsize=(16,8))
sns.scatterplot(
    data=df,
    x='date',
    y='avg_temperature',
    hue='country',
    size='energy_consumption',  # bubble size
    sizes=(20, 200),            # min and max bubble size
    alpha=0.6,
    palette='tab20'
)
plt.title("Daily Average Temperature by Country (Bubble size = Energy Consumption)")
plt.xlabel("Date")
plt.ylabel("Avg Temperature (°C)")
plt.legend(loc='upper right', bbox_to_anchor=(1.3,1), title="Country")
plt.show()

# %%
# 3. Bubble plot: Daily CO2 Emission
plt.figure(figsize=(16,8))
sns.scatterplot(
    data=df,
    x='date',
    y='co2_emission',
    hue='country',
    size='energy_consumption',  # bubble size
    sizes=(20, 200),
    alpha=0.6,
    palette='tab20'
)
plt.title("Daily CO2 Emission by Country (Bubble size = Energy Consumption)")
plt.xlabel("Date")
plt.ylabel("CO2 Emission")
plt.legend(loc='upper right', bbox_to_anchor=(1.3,1), title="Country")
plt.show()

# %%
# 4. Yearly Average Energy Consumption per Country
df_yearly = df.groupby(['country', pd.Grouper(key='date', freq='YE')])['energy_consumption'].mean().reset_index()

plt.figure(figsize=(16,6))
sns.lineplot(
    data=df_yearly,
    x='date',
    y='energy_consumption',
    hue='country',
    marker='o',
    palette='tab20'
)
plt.title("Yearly Average Energy Consumption by Country")
plt.xlabel("Year")
plt.ylabel("Energy Consumption (kWh)")
plt.legend(loc='upper right', bbox_to_anchor=(1.15,1))
plt.show()

# %% [markdown]
# # Climate & Energy: China Bubble Plots
# Daily Avg Temperature and CO2 Emission (Bubble size = Energy Consumption)

# %%
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_theme(style="whitegrid")
plt.rcParams["figure.figsize"] = (14,6)

# %%
# 1. Load dataset
df = pd.read_csv("datasets/climate.csv")

# Convert date to datetime
df['date'] = pd.to_datetime(df['date'])

# Filter for China only
df_china = df[df['country'] == "China"].sort_values('date')

# %%
# 2. Bubble plot: Daily Average Temperature
plt.figure(figsize=(14,6))
sns.scatterplot(
    data=df_china,
    x='date',
    y='avg_temperature',
    size='energy_consumption',  # bubble size
    sizes=(20, 200),
    color='red',
    alpha=0.6
)
plt.title("Daily Average Temperature in China (Bubble size = Energy Consumption)")
plt.xlabel("Date")
plt.ylabel("Avg Temperature (°C)")
plt.show()

# %%
# 3. Bubble plot: Daily CO2 Emission
plt.figure(figsize=(14,6))
sns.scatterplot(
    data=df_china,
    x='date',
    y='co2_emission',
    size='energy_consumption',  # bubble size
    sizes=(20, 200),
    color='green',
    alpha=0.6
)
plt.title("Daily CO2 Emission in China (Bubble size = Energy Consumption)")
plt.xlabel("Date")
plt.ylabel("CO2 Emission")
plt.show()

# %% [markdown]
# # Yearly Average CO2 Emission of China - Pastel Bar Graph

# %%
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_theme(style="whitegrid")
plt.rcParams["figure.figsize"] = (12,6)

# %%
# Load dataset
df = pd.read_csv("datasetsclimate.csv")
df['date'] = pd.to_datetime(df['date'])

# Filter for China
df_china = df[df['country'] == "China"]

# Yearly aggregation
df_china_yearly = df_china.groupby(pd.Grouper(key='date', freq='YE'))['co2_emission'].mean().reset_index()

# %%
# Pastel color palette
colors = sns.color_palette("pastel", len(df_china_yearly))

plt.figure(figsize=(10,6))
bars = plt.bar(df_china_yearly['date'].dt.year.astype(str),
               df_china_yearly['co2_emission'],
               color=colors,
               edgecolor='black',
               width=0.5)  # thinner bars

# Add value labels on top
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, height + 5, f'{height:.1f}',
             ha='center', va='bottom', fontsize=10)

plt.title("Yearly Average CO2 Emission of China", fontsize=16, fontweight='bold')
plt.xlabel("Year", fontsize=12)
plt.ylabel("CO2 Emission", fontsize=12)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

Week 1: Introduction to Datascience and Jupyter¶

Assignment 1: Dataset¶

Student Stress Anlysis¶

Description¶

Content¶

Context¶

Link:¶

Navigate through Jupyter Interface¶

Change Nav bar¶

Upload images¶

Installed Flameshot¶

References:¶

Data Visualisation¶

Bar Graph¶

Bubble Chart¶

Description¶

About the New Dataset¶

Main Features¶

Purpose¶

Reference¶

Data Visualisation¶

Daily average temperature and Daily CO₂ emission for China¶

References¶

Daily Average Temperature Bubble Plot¶

Daily CO₂ Emission Bubble Plot¶

Chatgpt prompts¶