2025年04月12日 星期六
北京市科技装备业商会公共邮箱:btecc@btecc.org.cn


首页 >  会员之窗  >  会员动态

会员动态丨远鉴斩获IEEE SLT 2024三项竞赛冠亚军

作者: 商会秘书处    时间: 2024-07-22    浏览量: 551   

    喜报!远鉴信息斩获IEEE SLT 2024三个主题挑战赛竞赛荣誉:口吃事件检测和语音识别挑战赛第一名、歌声深度伪造检测挑战赛第一名、源说话人溯源挑战赛第二名。    SLT(Spoken Language Technology)是由IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理技术委员会(Speech and Language Processing Technical Committee,SLTC)主办的语音与语言处理研究领域的国际顶尖会议,举办特定主题挑战赛是SLT大会议程的亮点。远鉴信息报名参与的三项主题挑战赛难度系数空前,严格限制了成果提交的时间窗口与尝试次数,这对竞赛团队来说无异于在进行一场高难度的“盲打”比赛。

    口吃事件检测和语音识别挑战赛(Stuttering Speech Challenge,SSC)是由StammerTalk、希尔贝壳、西工大音频语音与语言处理研究组、新加坡南洋理工大学、昆山杜克大学、中国科学技术大学、南开大学、WeNet开源社区等单位发起的SLT2024 旗舰赛事,这是首个中文此类挑战赛。
    歌声深度伪造检测挑战赛(Singing Voice Deepfake Detection Challenge,SVDD)是由美国罗切斯特大学、卡内基梅隆大学和日本名古屋大学联合承办,这是首个专注于实验室控制环境和野外真实及深度伪造歌唱声音记录的研究挑战,旨在汇集学术界和工业界的资源,开发出创新和有效的技术来检测伪造的歌声。
    源说话人溯源挑战赛(Source Speaker Tracing Challenge,SSTC)由昆山杜克大学、中科院声学所、武汉大学、美国约翰霍普金斯大学及日本山梨大学相关团队联合举办的SLT2024的旗舰赛事。

    面对一系列极具挑战性的课题,远鉴信息依托自身在语音技术领域的深厚积淀,在口吃事件检测和语音识别挑战赛(SSC)上,竞赛团队研发的语音识别系统能够有效将含有口吃事件的语音识别为干净文本,语音识别错误率仅12.3%。在歌声深度伪造检测(SVDD)比赛过程中,竞赛团队利用大量歌声数据进行模型训练、验证,实现了对歌声细微差异的精准捕捉。在源说话人溯源挑战赛(SSTC)中,竞赛团队凭借自主研发深度合成音频鉴别算法,大幅提升了溯源的准确性和速度。口吃事件检测和语音识别挑战赛”成绩排名,图源IEEE官网

    远鉴荣获IEEE SLT 2024三项竞赛荣誉,这不仅是对公司在语音与语言处理研究领域技术实力的认可,更为行业的技术应用提供了新思路、新方向。

1.识别口吃语音,推动语音技术包容性
    专为口吃用户研发的语音识别技术能够更准确、快速的将言语转换为文本,减少沟通障碍。在医疗领域,将口吃语音识别技术应用到语言治疗软件或设备中,有助于言语治疗师更早地识别和治疗口吃问题。同时,这项创新技术展现了语音技术发展的包容性,能够应用在移动设备、智能家居、聊天机器人等智能产品上,为言语障碍等人群提供更加友好的交互体验。
2.检测伪造歌声,赋能音乐产业发展
    歌声深度伪造检测技术能够有效识别伪造歌声,保护音乐作品的真实性和独特性。该技术还可以检测未经授权篡改音乐作品的行为,维护原作者的合法权益,为音乐创作和版权保护提供坚实的技术支持。
3.抵御语音欺骗攻击,保障财产安全
    源说话人溯源技术不仅能确保说话人验证系统抵御语音合成、语音转换、语音编辑等各种欺骗攻击,还能从被篡改的语音信号中识别源说话人信息。对于这项技术的深入研究,将有助于在犯罪调查和司法程序中,快速识别涉及基于语音转换欺骗攻击手段的金融欺诈嫌疑人。
    更重要的是,随着这些前沿成果逐步融入到多样化的实际应用场景中,它们不仅能为各个领域的技术革新注入灵感,更能为推动社会整体发展提供动能。在未来,远鉴将持续深耕人工智能技术和信息安全领域,为各行各业的蓬勃发展注入源源不断的驱动力。

版权所有:北京市科技装备业商会  地址:北京市海淀区闵庄路 42号院1号楼4层458室 邮编:100094 电话:010-66007877

京ICP备2021029670号  京公网安备11010802043462