#show a few random example pictures (brought this cell up to the front just for show)

# Helper to unnormalize the pictures so we can show the original (this cell was coded last in the notebook)
def unnormalize(img_tensor):
    img = img_tensor.clone().permute(1, 2, 0).cpu().numpy()
    img = (img * 0.5) + 0.5  # reverse normalization
    img = np.clip(img, 0, 1)
    return img

# Plot
plt.figure(figsize=(14, 8))
for i in range(8):
    img = unnormalize(images[i])
    label = emotion_labels[int(labels[i])]

    plt.subplot(2, 4, i + 1)
    plt.imshow(img.squeeze(), cmap='gray' if img.shape[2] == 1 else None)
    plt.title(label)
    plt.axis('off')

plt.tight_layout()
plt.show()

import os
from torchvision.datasets import ImageFolder
from torch.utils.data import DataLoader
from torchvision import transforms
import albumentations as A
from albumentations.pytorch import ToTensorV2
from torchvision.datasets.folder import default_loader
import numpy as np

class AlbumentationsDataset(ImageFolder):
    def __init__(self, root, transform=None):
        super().__init__(root, transform=None)
        self.albumentations_transform = transform

    def __getitem__(self, index):
        path, target = self.samples[index]
        sample = default_loader(path)
        sample = np.array(sample)
        if self.albumentations_transform:
            sample = self.albumentations_transform(image=sample)["image"]
        return sample, target

# Transforms
train_transform = A.Compose([
    A.Resize(224, 224),
    A.HorizontalFlip(p=0.5),
    A.ShiftScaleRotate(shift_limit=0.05, scale_limit=0.05, rotate_limit=10),
    A.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2),
    A.Normalize(),
    ToTensorV2()
])

val_transform = A.Compose([
    A.Resize(224, 224),
    A.Normalize(),
    ToTensorV2()
])

train_ds = AlbumentationsDataset("train", transform=train_transform)
val_ds = AlbumentationsDataset("test", transform=val_transform)

train_loader = DataLoader(train_ds, batch_size=64, shuffle=True)
val_loader = DataLoader(val_ds, batch_size=64, shuffle=False)

import timm
import torch.nn as nn
import torch

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

model = timm.create_model("efficientnet_b3", pretrained=True, num_classes=7)
model = model.to(device)

import torch
import torch.nn as nn
import torch.optim as optim
from tqdm import tqdm
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns

# ---- Setup ----
criterion = nn.CrossEntropyLoss()
optimizer = optim.AdamW(model.parameters(), lr=3e-4)
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10)

best_val_acc = 0
epochs_no_improve = 0
patience = 2
num_epochs = 20

train_acc_list = []
val_acc_list = []

# ---- Training Loop ----
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    correct = 0

    for x, y in tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}"):
        x, y = x.to(device), y.to(device)
        optimizer.zero_grad()
        out = model(x)
        loss = criterion(out, y)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
        correct += (out.argmax(1) == y).sum().item()

    train_acc = correct / len(train_ds)
    train_acc_list.append(train_acc)

    # ---- Validation ----
    model.eval()
    val_correct = 0
    val_total = 0
    with torch.no_grad():
        for x_val, y_val in val_loader:
            x_val, y_val = x_val.to(device), y_val.to(device)
            y_pred = model(x_val)
            val_correct += (y_pred.argmax(1) == y_val).sum().item()
            val_total += y_val.size(0)

    val_acc = val_correct / val_total
    val_acc_list.append(val_acc)

    print(f"Epoch {epoch+1}, Train Acc: {train_acc:.4f}, Loss: {total_loss:.4f}, Val Acc: {val_acc:.4f}")

    # ---- Early Stopping ----
    if val_acc > best_val_acc:
        best_val_acc = val_acc
        epochs_no_improve = 0
        torch.save(model.state_dict(), "best_model.pth")
        print("New best model saved.")
    else:
        epochs_no_improve += 1
        print(f"No improvement. Patience: {epochs_no_improve}/{patience}")

    if epochs_no_improve >= patience:
        print("Early stopping triggered.")
        break

    scheduler.step()

# ---- Plot Accuracies ----
plt.figure(figsize=(10, 5))
plt.plot(train_acc_list, label="Train Accuracy")
plt.plot(val_acc_list, label="Validation Accuracy")
plt.xlabel("Epoch")
plt.ylabel("Accuracy")
plt.title("Training vs Validation Accuracy")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

Epoch 1/20: 100%|██████████| 449/449 [1:08:56<00:00,  9.21s/it]

Epoch 1, Train Acc: 0.5422, Loss: 563.4186, Val Acc: 0.6310
New best model saved.

Epoch 2/20: 100%|██████████| 449/449 [1:06:05<00:00,  8.83s/it]

Epoch 2, Train Acc: 0.6780, Loss: 392.2814, Val Acc: 0.6636
New best model saved.

Epoch 3/20: 100%|██████████| 449/449 [1:06:54<00:00,  8.94s/it]

Epoch 3, Train Acc: 0.7505, Loss: 304.4303, Val Acc: 0.6808
New best model saved.

Epoch 4/20: 100%|██████████| 449/449 [1:06:14<00:00,  8.85s/it]

Epoch 4, Train Acc: 0.8263, Loss: 217.6914, Val Acc: 0.6796
No improvement. Patience: 1/2

Epoch 5/20: 100%|██████████| 449/449 [1:06:54<00:00,  8.94s/it]

Epoch 5, Train Acc: 0.8932, Loss: 137.3717, Val Acc: 0.6906
New best model saved.

#-------- Model Eval -----------
model.load_state_dict(torch.load("best_model.pth"))  # Load best model
model.eval()

all_preds = []
all_labels = []

with torch.no_grad():
    for x, y in val_loader:
        x, y = x.to(device), y.to(device)
        preds = model(x).argmax(1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(y.cpu().numpy())

print(classification_report(all_labels, all_preds, target_names=train_ds.classes))

# Confusion matrix
cm = confusion_matrix(all_labels, all_preds)
plt.figure(figsize=(8,6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
            xticklabels=train_ds.classes, yticklabels=train_ds.classes)
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Confusion Matrix')
plt.tight_layout()
plt.show()

              precision    recall  f1-score   support

       angry       0.63      0.61      0.62       958
     disgust       0.75      0.71      0.73       111
        fear       0.57      0.54      0.55      1024
       happy       0.89      0.87      0.88      1774
     neutral       0.64      0.69      0.66      1233
         sad       0.60      0.59      0.60      1247
    surprise       0.79      0.85      0.82       831

    accuracy                           0.70      7178
   macro avg       0.70      0.69      0.69      7178
weighted avg       0.70      0.70      0.70      7178

correct = sum([p == t for p, t in zip(all_preds, all_labels)])
print(f"Final Accuracy: {correct / len(all_labels):.4f}")

Final Accuracy: 0.7042

import torch, timm
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from tqdm import tqdm
import matplotlib.pyplot as plt

# --- Model Definition ---
class CustomModel(nn.Module):
    def __init__(self, base_model, num_classes):
        super().__init__()
        self.backbone = base_model
        in_features = self.backbone.classifier.in_features
        self.backbone.classifier = nn.Identity()
        self.dropout = nn.Dropout(0.3)
        self.fc = nn.Linear(in_features, num_classes)

    def forward(self, x):
        x = self.backbone(x)
        x = self.dropout(x)
        return self.fc(x)

base_model = timm.create_model("efficientnet_b3a", pretrained=True)
model = CustomModel(base_model, num_classes=7).to(device)

# --- Label Smoothing Loss ---
class LabelSmoothingLoss(nn.Module):
    def __init__(self, classes, smoothing=0.1):
        super().__init__()
        self.confidence = 1.0 - smoothing
        self.smoothing = smoothing
        self.cls = classes

    def forward(self, pred, target):
        pred = pred.log_softmax(dim=-1)
        true_dist = torch.zeros_like(pred)
        true_dist.fill_(self.smoothing / (self.cls - 1))
        true_dist.scatter_(1, target.data.unsqueeze(1), self.confidence)
        return torch.mean(torch.sum(-true_dist * pred, dim=-1))

# --- Training Setup ---
criterion = LabelSmoothingLoss(classes=7, smoothing=0.1)
optimizer = optim.AdamW(model.parameters(), lr=1e-4, weight_decay=1e-2)
scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10)

best_val_acc = 0
epochs_no_improve = 0
patience = 3
num_epochs = 20
train_acc_list, val_acc_list = [], []

# --- Training Loop ---
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    correct = 0

    for x, y in tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}"):
        x, y = x.to(device), y.to(device)
        optimizer.zero_grad()
        out = model(x)
        loss = criterion(out, y)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
        correct += (out.argmax(1) == y).sum().item()

    train_acc = correct / len(train_ds)
    train_acc_list.append(train_acc)

    # --- Validation ---
    model.eval()
    val_correct, val_total = 0, 0
    with torch.no_grad():
        for x_val, y_val in val_loader:
            x_val, y_val = x_val.to(device), y_val.to(device)
            y_pred = model(x_val)
            val_correct += (y_pred.argmax(1) == y_val).sum().item()
            val_total += y_val.size(0)

    val_acc = val_correct / val_total
    val_acc_list.append(val_acc)

    print(f"Epoch {epoch+1}, Train Acc: {train_acc:.4f}, Loss: {total_loss:.4f}, Val Acc: {val_acc:.4f}")

    # --- Early Stopping ---
    if val_acc > best_val_acc:
        best_val_acc = val_acc
        epochs_no_improve = 0
        torch.save(model.state_dict(), "best_model_improved.pth")
        print(" New best model saved.")
    else:
        epochs_no_improve += 1
        print(f"No improvement. Patience: {epochs_no_improve}/{patience}")

    if epochs_no_improve >= patience:
        print(" Early stopping triggered.")
        break

    scheduler.step()

# --- Plot Accuracy Curves ---
plt.figure(figsize=(10, 5))
plt.plot(train_acc_list, label="Train Accuracy")
plt.plot(val_acc_list, label="Validation Accuracy")
plt.xlabel("Epoch")
plt.ylabel("Accuracy")
plt.title("Training vs Validation Accuracy (Improved)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

C:\Users\forca\anaconda3\Lib\site-packages\timm\models\_factory.py:138: UserWarning: Mapping deprecated model name efficientnet_b3a to current efficientnet_b3.
  model = create_fn(
Epoch 1/20: 100%|██████████| 449/449 [1:09:48<00:00,  9.33s/it]

Epoch 1, Train Acc: 0.5174, Loss: 645.5958, Val Acc: 0.6245
 New best model saved.

Epoch 2/20: 100%|██████████| 449/449 [1:08:04<00:00,  9.10s/it]

Epoch 2, Train Acc: 0.6634, Loss: 525.2005, Val Acc: 0.6654
 New best model saved.

Epoch 3/20: 100%|██████████| 449/449 [1:05:10<00:00,  8.71s/it]

Epoch 3, Train Acc: 0.7318, Loss: 468.2296, Val Acc: 0.6786
 New best model saved.

Epoch 4/20: 100%|██████████| 449/449 [1:04:41<00:00,  8.64s/it]

Epoch 4, Train Acc: 0.8015, Loss: 414.8496, Val Acc: 0.6888
 New best model saved.

Epoch 5/20: 100%|██████████| 449/449 [1:04:42<00:00,  8.65s/it]

Epoch 5, Train Acc: 0.8524, Loss: 370.4793, Val Acc: 0.6865
No improvement. Patience: 1/3

import torch
import torch.nn as nn
import torch.optim as optim
from tqdm import tqdm
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns
import timm

# ---- Load ConvNeXt Tiny Backbone ----
model = timm.create_model("convnext_tiny.fb_in22k", pretrained=True, num_classes=7)
model = model.to("cuda" if torch.cuda.is_available() else "cpu")
device = next(model.parameters()).device

# ---- Loss, Optimizer, Scheduler ----
criterion = nn.CrossEntropyLoss()
optimizer = optim.AdamW(model.parameters(), lr=3e-4)
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10)

# ---- Training Config ----
best_val_acc = 0
epochs_no_improve = 0
patience = 3
num_epochs = 20
train_acc_list = []
val_acc_list = []

# ---- Training Loop ----
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    correct = 0

    for x, y in tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}"):
        x, y = x.to(device), y.to(device)
        optimizer.zero_grad()
        out = model(x)
        loss = criterion(out, y)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
        correct += (out.argmax(1) == y).sum().item()

    train_acc = correct / len(train_ds)
    train_acc_list.append(train_acc)

    # ---- Validation ----
    model.eval()
    val_correct = 0
    val_total = 0
    with torch.no_grad():
        for x_val, y_val in val_loader:
            x_val, y_val = x_val.to(device), y_val.to(device)
            y_pred = model(x_val)
            val_correct += (y_pred.argmax(1) == y_val).sum().item()
            val_total += y_val.size(0)

    val_acc = val_correct / val_total
    val_acc_list.append(val_acc)

    print(f"Epoch {epoch+1}, Train Acc: {train_acc:.4f}, Loss: {total_loss:.4f}, Val Acc: {val_acc:.4f}")

    # ---- Early Stopping ----
    if val_acc > best_val_acc:
        best_val_acc = val_acc
        epochs_no_improve = 0
        torch.save(model.state_dict(), "best_convnext_model.pth")
        print("New best model saved.")
    else:
        epochs_no_improve += 1
        print(f"No improvement. Patience: {epochs_no_improve}/{patience}")

    if epochs_no_improve >= patience:
        print(" Early stopping triggered.")
        break

    scheduler.step()

# ---- Plot Accuracy ----
plt.figure(figsize=(10, 5))
plt.plot(train_acc_list, label="Train Accuracy")
plt.plot(val_acc_list, label="Validation Accuracy")
plt.xlabel("Epoch")
plt.ylabel("Accuracy")
plt.title("ConvNeXt: Train vs Validation Accuracy")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

# ---- Model Evaluation ----
model.load_state_dict(torch.load("best_convnext_model.pth"))
model.eval()

all_preds = []
all_labels = []

with torch.no_grad():
    for x, y in val_loader:
        x, y = x.to(device), y.to(device)
        preds = model(x).argmax(1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(y.cpu().numpy())

print(classification_report(all_labels, all_preds, target_names=train_ds.classes))

cm = confusion_matrix(all_labels, all_preds)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
            xticklabels=train_ds.classes, yticklabels=train_ds.classes)
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Confusion Matrix - ConvNeXt Tiny')
plt.tight_layout()
plt.show()

model.safetensors:   0%|          | 0.00/178M [00:00<?, ?B/s]

C:\Users\forca\anaconda3\Lib\site-packages\huggingface_hub\file_download.py:143: UserWarning: `huggingface_hub` cache-system uses symlinks by default to efficiently store duplicated files but your machine does not support them in C:\Users\forca\.cache\huggingface\hub\models--timm--convnext_tiny.fb_in22k. Caching files will still work but in a degraded version that might require more space on your disk. This warning can be disabled by setting the `HF_HUB_DISABLE_SYMLINKS_WARNING` environment variable. For more details, see https://huggingface.co/docs/huggingface_hub/how-to-cache#limitations.
To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
  warnings.warn(message)
Epoch 1/20: 100%|██████████| 449/449 [47:35<00:00,  6.36s/it]

Epoch 1, Train Acc: 0.5935, Loss: 482.8378, Val Acc: 0.6468
New best model saved.

Epoch 2/20: 100%|██████████| 449/449 [47:56<00:00,  6.41s/it]

Epoch 2, Train Acc: 0.6915, Loss: 374.9729, Val Acc: 0.6737
New best model saved.

Epoch 3/20: 100%|██████████| 449/449 [50:55<00:00,  6.81s/it]

Epoch 3, Train Acc: 0.7429, Loss: 311.3200, Val Acc: 0.6946
New best model saved.

Epoch 4/20: 100%|██████████| 449/449 [47:58<00:00,  6.41s/it]

Epoch 4, Train Acc: 0.8070, Loss: 239.1212, Val Acc: 0.7112
New best model saved.

Epoch 5/20: 100%|██████████| 449/449 [47:36<00:00,  6.36s/it]

Class	Precision	Recall	F1-Score	Support
Angry	0.64	0.66	0.65	958
Disgust	0.79	0.68	0.73	111
Fear	0.62	0.56	0.59	1024
Happy	0.89	0.90	0.90	1774
Neutral	0.67	0.70	0.69	1233
Sad	0.60	0.60	0.60	1247
Surprise	0.83	0.84	0.83	831
Accuracy			0.72	7178
Macro Avg	0.72	0.71	0.71	7178
Weighted Avg	0.72	0.72	0.72	7178

Facial Expression Classification Using CNNs¶

Overview¶

Data¶

Methods & Materials¶

Outcomes¶

Conclusion¶

Discussion¶

Future Improvements:¶