from py_salt import dataset_info, event_mapping


dataset_info.get_mapped_dataset()

['AudioSet',
 'AudioSet strong',
 'FreeSound 50k',
 'ESC-50',
 'SINGA:PURA',
 'MAESTRO Real - Multi-Annotator Estimated Strong Labels',
 'Urban Sound & Sight',
 'MAVD-traffic',
 'IDMT-traffic',
 'UrbanSound8k',
 'TUT Sound Events 2016',
 'TUT Sound Events 2017',
 'MAESTRO Synthetic – Multiple Annotator Estimated STROng labels',
 'SONY-UST',
 'ARCHEO',
 'TAU NIGENS Spatial Sound Events 2020',
 'TUT Rare Sound Events 2017',
 'CHiME-Home',
 'ReaLISED: Real-Life Indoor Sound Event Dataset',
 'DESED',
 'STARSS22: Sony-TAu Realistic Spatial Soundscapes 2022 dataset',
 'STARSS23: Sony-TAu Realistic Spatial Soundscapes 2023',
 'MATS – Multi-Annotator Tagged Soundscapes',
 'Nonspeech7k',
 'AnimalSound',
 'NIGENS (Neural Information Processing group GENeral sounds)']


dataset_info.Singapura().get_info()

{'name': 'SINGA:PURA',
 'mapping_id': 'Singapura',
 'url': 'https://paperswithcode.com/dataset/singa-pura/',
 'subset_of': 'None',
 'description': 'Strongly-labelled polyphonic urban sound dataset with spatiotemporal context'}


dataset_info.TUTSoundEvents2016().get_info()

{'name': 'TUT Sound Events 2016',
 'mapping_id': 'TUTSoundEvents2016',
 'url': 'https://zenodo.org/records/45759',
 'subset_of': 'None',
 'description': 'TUT Sound events 2016, development dataset consists of 22 audio recordings from two acoustic scenes: Home and Residential area.',
 'source_audio': 'TUT Acoustic Scenes: "home" and "residential area"'}


# Init Event Explorer class
e = event_mapping.EventExplorer()

e.map_df


e.get_mapping_for_std_label('car_horn')

{'Singapura': ['Car horn'],
 'UrbanSound8K': ['car horn'],
 'ESC50': ['car_horn'],
 'MAESTROsynthetic': ['car_horn'],
 'SONYC': ['car-horn'],
 'AudioSet_strong': ['Toot', 'Vehicle horn, car horn, honking, toot'],
 'AudioSet': ['Toot', 'Vehicle horn, car horn, honking'],
 'Fsd50k': ['Vehicle_horn_and_car_horn_and_honking']}


e.get_mapping_for_dataset_label('Car horn') # Singapura's default label

{'Singapura': ['Car horn'],
 'UrbanSound8K': ['car horn'],
 'ESC50': ['car_horn'],
 'MAESTROsynthetic': ['car_horn'],
 'SONYC': ['car-horn'],
 'AudioSet_strong': ['Toot', 'Vehicle horn, car horn, honking, toot'],
 'AudioSet': ['Toot', 'Vehicle horn, car horn, honking'],
 'Fsd50k': ['Vehicle_horn_and_car_horn_and_honking']}


# Define a standard label
std_label = 'vehicle_horn'

parent = e.get_parent_label_for_std_label(std_label)
siblings = e.get_siblings_labels_for_std_label(std_label)
children = e.get_children_labels_for_std_label(std_label)

print('Parent label(s):', parent)
print('Sibling label(s):', siblings)
print('Children label(s):', children)

Parent label(s): ['road_vehicle', 'alarm_signal']
Sibling label(s): {'road_vehicle': ['emergency_vehicle', 'vehicle_engine', 'car', 'motorcycle', 'large vehicle', 'vehicle_passing_by', 'brakes_squeaking'], 'alarm_signal': ['error_signal', 'CO_detector', 'whistle', 'foghorn_ringing', 'buzzer_ringing', 'siren_ringing', 'car_alarm_ringing', 'fire_alarm_ringing', 'telephone', 'bicycle_bell', 'alarm_clock_ringing', 'doorbell']}
Children label(s): ['air_horn_or_truck_horn', 'car_horn']


std_label = 'toothbrush'

coarse_labels = e.get_coarse_labels_for_std_label(std_label)
fine_labels = e.get_fine_labels_for_std_label(std_label)

print('Coarse labels:', coarse_labels)
print('Fine labels:', fine_labels)

Coarse labels: ['domestic_sounds', 'bathroom_sounds', 'brushing_teeth', 'sound_of_things']
Fine labels: ['electric_toothbrush']


e.get_paths_to_label('car_horn')

[['sound_of_things', 'vehicle', 'road_vehicle', 'vehicle_horn', 'car_horn'],
 ['sound_of_things', 'alarm_signal', 'vehicle_horn', 'car_horn']]


e.get_paths_to_label('toothbrush')

[['sound_of_things', 'domestic_sounds', 'brushing_teeth', 'toothbrush'],
 ['sound_of_things', 'bathroom_sounds', 'brushing_teeth', 'toothbrush']]


e.get_mapped_datasets()

['Fsd50k',
 'AudioSet_strong',
 'AudioSet',
 'ESC50',
 'Singapura',
 'MAESTROreal',
 'TUTSoundEvents2017',
 'Urbansas',
 'MAVDtraffic',
 'IDMTtraffic',
 'UrbanSound8K',
 'TUTSoundEvents2016',
 'MAESTROsynthetic',
 'SONYC',
 'Archeo',
 'TAUNIGENSSpatialSoundEvents2020',
 'Nigens',
 'TUTRareSoundEvents',
 'CHiMEHome',
 'ReaLISED',
 'DESEDReal',
 'Starss22',
 'Starss23',
 'MATS',
 'Nonspeech7k',
 'AnimalSound']


dataset_list = ['Urbansas', 'Singapura', 'MAVDtraffic', 'IDMTtraffic', 'UrbanSound8K', 'SONYC']

# Get all standard events that are common across all datasets
std_labels = e.find_datasets_intersection(dataset_list)

dataset_labels = {}
# For each standard event, retrieve the dataset default labels
for std_label in std_labels:
  dataset_labels.update(e.get_mapping_for_std_label(std_label))

# Remove the rest of the datasets
filtered_dict = {dataset: dataset_labels[dataset] for dataset in dataset_list}
filtered_dict

{'Urbansas': ['bus', 'motorbike', 'offscreen', 'truck'],
 'Singapura': ['Chainsaw',
  'Engine',
  'Large engine',
  'Medium engine',
  'Smallenginge'],
 'MAVDtraffic': ['bus',
  'bus/engine_accelerating',
  'bus/engine_idling',
  'bus/compressor',
  'car/engine_accelerating',
  'car/engine_idling',
  'motorcycle',
  'motorcycle/engine_accelerating',
  'motorcycle/engine_idling',
  'truck',
  'truck/compressor',
  'truck/engine_accelerating',
  'truck/engine_idling'],
 'IDMTtraffic': ['bus', 'motorcycle', 'truck'],
 'UrbanSound8K': ['engine_idling'],
 'SONYC': ['chainsaw',
  'engine-of-uncertain-size',
  'large-sounding-engine',
  'medium-sounding-engine',
  'small-sounding-engine']}


dataset_list = [ 'TUTRareSoundEvents', 'CHiMEHome', 'ReaLISED']

# Get all standard events that are common across all datasets
std_labels = e.find_datasets_intersection(dataset_list)

dataset_labels = {}
# For each standard event, retrieve the dataset default labels
for std_label in std_labels:
  dataset_labels.update(e.get_mapping_for_std_label(std_label))

# Remove the rest of the datasets
filtered_dict = {dataset: dataset_labels[dataset] for dataset in dataset_list}
filtered_dict

{'TUTRareSoundEvents': ['babycry'],
 'CHiMEHome': ['Adult female speech', 'Adult male speech', 'Child speech'],
 'ReaLISED': ['speech']}


e.plot_std_label_mapping('car_horn')


e.plot_hierarchical_tree_graph('natural_sounds')


e.plot_dataset_tree_graph('ESC50')

py-salt¶

Mapped Datasets¶

Event Mapping Exploration¶

Label Aggregation¶

Hierarchical Label Searching¶

Dataset Intersection¶

Example 1: Urban Sound Monitoring Datasets¶

Plotting Utilities¶

	standard_event	dataset_label	dataset
0	vehicle	Accelerating_and_revving_and_vroom	Fsd50k
1	vehicle	Accelerating, revving, vroom	AudioSet_strong
2	vehicle	Accelerating, revving, vroom	AudioSet
3	vehicle	Air brake	AudioSet
4	vehicle	Air brake	AudioSet_strong
...	...	...	...
7227	sound_of_things	Jackhammer	AudioSet
7228	lock	Lock	AudioSet_strong
7229	chain	Chain	AudioSet_strong
7230	audio_feedback	Audio feedback	AudioSet_strong
7231	windscreen_wiper	Windscreen wiper, windshield wiper	AudioSet_strong