IEEE International Conference on Multimedia and Expo 2025(ICME 2025) 将于 6月30日至7月4日在法国南特举行。作为全球多媒体领域的顶级会议之一,ICME 2025 汇聚全球顶尖学者与产业专家,聚焦人工智能驱动的多媒体技术,涵盖图像与视频处理、多媒体分析与生成、社交媒体分析等AI相关主题。
音频编码器能力挑战赛依托于ICME 2025会议平台,由 小米集团、萨里大学与海天瑞声 联合主办,旨在评估音频编码器在丰富的多样性任务中的表征能力。本次挑战赛的获奖结果及成果交流 Workshop 即将在ICME 2025会议现场举办。届时,将公布获奖团队,欢迎大家到场参与,聆听优秀参赛队伍做技术报告!
时间:7月1日(周二)10:15 AM – 11:30 AM
地点:南特会议中心 Room 450
-
什么是音频编码器?
音频编码器(Audio Encoder)是一种将原始音频信号进行压缩、编码的技术或算法。在AI领域中现代音频编码器不仅限于压缩,还被用于特征提取、多任务学习、通用音频理解模型等。
-
挑战赛简介
音频编码器能力挑战赛旨在评估音频编码器在丰富的多样性任务中的表征能力。本次挑战赛受 HEAR benchmark 启发,引入了多项核心增强点,包括多样化的任务集、面向真实世界的应用、参数化与非参数化评估方法相结合,以及一个全新的高效开源评估系统。
参赛者需提交预训练音频编码器,该编码器可将原始波形映射为连续的嵌入向量(embedding)。这些编码器将被用于多个不同任务的测试,包括语音、环境声音和音乐,重点考察其在真实场景中的可用性。
本次挑战设有两个赛道:
· Track A:参数化评估
· Track B:无参数(parameter-free)评估
该挑战赛为评估和推进音频编码设计的前沿技术提供了一个平台。
-
挑战赛时间表
· 2025年2月7日:挑战赛发布并启动
· 2025年4月1日:注册截止
· 2025年4月30日:提交截止
· 2025年5月27日:结果公布
· 2025年7月1日:颁奖及成果交流
7月1日 ICME 2025 法国 南特
音频编码器能力挑战赛 Workshop
期待您的到来!