Temporal Sequence Modeling for Sports Action Recognition

This project focuses on fine-grained sports action recognition using two main architectures:

CNN-based Sequence Models: These models combine CNNs for feature extraction with RNNs(GRU layers) for temporal sequence modeling:
- VGG19
- InceptionV3
- InceptionV4-ResNet (hybrid model)
- EfficientNetB4
ViViT (Video Vision Transformer): A pure transformer-based approach for end-to-end video classification, capturing both spatial and temporal features.

Model Architectures

1. CNN-based Sequence Models

Feature Extractors: VGG19, InceptionV3, InceptionV4-ResNet, EfficientNetB4
Temporal Model: GRU layers

2. ViViT Model

Transformer-based model for video classification
Spatiotemporal attention and tubelet embedding

Evaluation

Each model is evaluated using:

Accuracy, Precision, Recall, F1-Score
Training/validation curves
Confusion matrix

Acknowledgments

Dr. Lina Chato
UCF101 dataset
TensorFlow team
All the cited authors

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
.devcontainer		.devcontainer
models		models
notebooks		notebooks
src		src
.gitignore		.gitignore
README.MD		README.MD

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Temporal Sequence Modeling for Sports Action Recognition

Model Architectures

1. CNN-based Sequence Models

2. ViViT Model

Evaluation

Acknowledgments

About

Releases

Packages

Contributors 2

Languages

denpalrius/sports_action_recognition

Folders and files

Latest commit

History

Repository files navigation

Temporal Sequence Modeling for Sports Action Recognition

Model Architectures

1. CNN-based Sequence Models

2. ViViT Model

Evaluation

Acknowledgments

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages