MULTIBENCH: Multiscale Benchmarks for Multimodal Representation Learning
NIPS 2021, datasets and benchmarks track, MULTIBENCH: Multiscale Benchmarks for Multimodal Representation Learning。代码:MultiBench。这是个benchmark,涵盖15个数据集,10个模态,20个预测任务,6个研究领域。
这是个benchmark,涵盖15个数据集,10个模态,20个预测任务,6个研究领域。
评估三项内容:
- generalization
- time and space complexity
- modality robustness
提供了20个关于融合、优化目标、训练方法的核心方法的标准实现。
1 Introduction
A modality refers to a way in which a signal exists or is experienced.模态是指数据的存在或表现形式。
Limitations of current multimodal datasets:现在的多模态主要研究图像和文本,其他模态太少了。此外,当前的benchmark过分关注效果,忽略了时间和空间复杂度,同时也忽略了一些不完美的模态带来的鲁棒性的下降。在实际应用中,以上三点都应该被考虑。