Vggsound: A Large-Scale Audio-Visual Dataset

Collection:

IEEE ICASSP 2020 Virtual Conference May 2020

Our goal is to collect a large-scale audio-visual dataset with low label noise from videos `in the wild' using computer vision techniques. The resulting dataset can be used for training and evaluating audio recognition models. We make three contributions.

IEEE MemberUS $11.00
Society MemberUS $0.00
IEEE Student MemberUS $11.00
Non-IEEE MemberUS $15.00

Purchase

All Channels page: Communities submenu block

Communities

IEEE Awards

IEEE TechEthics™

IEEE Students

IEEE Women in Engineering

IEEE Future Networks

All Channels page: Societies submenu block

Societies

IEEE Society on Social Implications of Technology

IEEE Computer Society

IEEE Signal Processing Society

IEEE Power Electronics Society

IEEE Nuclear and Plasma Sciences Society

Events Showcase: ES submenu block

Event showcases

Recently Added Speakers

Events Hub Submenu block

Education: Education submenu block

Education Activity

30 Years to High Temperature Superconductivity (HTS): Status and Perspectives

Educational Resources for Humanitarian Activities - Michael Lightner - Brief Sessions: Sections Congress 2017

Implantable, Insertable and Wearable Micro-optical Devices for Early Detection of Cancer - Plenary Speaker, Christopher Contag - IPC 2018

Genetic Programming Hyper-heuristics for Combinatorial Optimisation: Yi Mei CIS Webinar

CIRCUIT DESIGN USING FINFETS

2020 EAB AWARDS

2020 EAB AWARDS

Vggsound: A Large-Scale Audio-Visual Dataset

About IEEE

All Channels page: Communities submenu block

Communities

All Channels page: Societies submenu block

Societies

Events Showcase: ES submenu block

Event showcases

Recently Added Speakers

Events Hub Submenu block

Education: Education submenu block

Education Activity

2020 EAB AWARDS

2020 EAB AWARDS

Vggsound: A Large-Scale Audio-Visual Dataset

Videos in this product