Working Projects

预训练模型高效迁移给下游任务

Research, Xiaomi, AI lab, 2022

和小米首席语音科学家Daniel Povey合作,重新定义知识蒸馏问题为一个编解码问题,将大规模预训练模型的能力迁移到下游ASR模型。相比于传统蒸馏方式快至少4.5倍(或者存储空间节省640倍),性能相对提升11.12%。

多模态语音建模

Challenge/Research, Xiaomi, AI lab, 2022

带队代表小米AI参加ICASSP旗下MISP2021挑战赛,赢得音视频唤醒赛道冠军,音视频识别赛道亚军

多通道端到端ASR

Project/Research, Xiaomi, AI lab, 2021

从0到1构建多通道ASR范式:构建大规模数据集、算法和评测集,对标谷歌、百度

视频会议降噪

Challenge/Research, Xiaomi, AI lab, 2021

带队代表小米AI参加INTERSPEECH旗下ConferencingSpeech2021比赛,获得非实时降噪赛道亚军

个性化声学模型

Project, Xiaomi, AI lab, 2021

构建可落地的个性化ASR:大幅改善障碍人士、线上重口音用户的语音识别率

三星远场语音识别系统

Project, Georgia Tech, Center for Signal and Image Processing, 2018

与三星总部研究院合作研发家居环境的远场语音识别系统

鲁棒性宽带波束形成

Research, Institute of Acoustics, Chinese Academy of Sciences, 2017

研究最优波束形成理论,提高波束形成器在强背景噪音和强干扰环境下的性能