IMPORTANT - the code assumes that the data is stored in the /media/magalhaes
directory, please change the paths accordingly.
Project collectively developed by the team at INESC-ID.
Includes the work done for the thesis of Diogo Ferrão: Data Augmentation for Urban Environmental Sound Classification on Edge Devices.
conda env create -f environment.yml
or
pip install -r requirements.txt
- Data sources
- Available Datasets
- Data Engine
- Add new data
- Create dataset
- Preprocess audio
- Search dataset
We also provide a more detailed description of the media structure in /media/magalhaes/README.md
/media/magalhaes
├── DAWN
│ ├── Sand
│ ├── Snow
│ ├── Fog
│ │ ├── images
│ │ └── labels
│ └── Rain
│ ├── images
│ └── labels
├── ESC-50
│ └── audio
├── ExDark
│ ├── images
│ └── labels
├── FSD50K
│ └── dev_audio
├── coco
│ ├── images
│ │ └── val2017
│ └── labels
│ └── val2017
├── emergency_vehicles
│ ├── images
│ └── labels
├── schreder
│ ├── labels
│ └── images
├── schreder_sound
│ ├── 15_12_2022
│ │ └── ground_truth
│ ├── 16_12_2022
│ │ └── ground_truth
│ ├── 18_12_2022
│ │ └── ground_truth
│ ├── 21_12_2022
│ │ └── ground_truth
│ ├── 22_9_2022
│ | └── ground_truth
│ ...
│ └── outdoor_silence
├── sound
│ ├── checkpoints
│ ├── datasets
│ ├── onnx
│ ├── pretrained
│ └── spectograms
└── vision
├── checkpoints
├── datasets
├── onnx
└── pretrained