王云 (Maigo)

我目前是 Facebook AI 应用研究部门语音团队的研究科学家,负责维护 Facebook 的声音事件检测系统。

我于2018年10月获得卡内基梅隆大学语言技术研究所(LTI)的博士学位。在学期间,我在 Florian Metze 教授的指导下进行声音事件检测研究。

我的研究兴趣包括语音识别和机器学习。

Maigo

工作经历

Facebook 公司

2018/11 至今 研究科学家,语音组,Facebook AI 应用研究部门
2015/01 ~ 2015/04 软件工程实习生,语言技术组

教育背景

卡内基梅隆大学

2012/08 ~ 2018/10 语言技术研究所(LTI)博士
2010/08 ~ 2012/08 语言技术研究所(LTI)硕士

清华大学

2006/08 ~ 2010/07 电子工程系 学士

项目经验

项目图片

声音事件检测系统

基于深度学习的声音事件检测系统,可以识别环境中的各种声音。该系统已成功部署在 Facebook 的产品中。

项目图片

语音识别系统

使用最新的 Transformer 架构实现的语音识别系统,支持多语言识别,准确率达到业界领先水平。

发表论文

2023年

  • 基于深度学习的环境声音事件检测
    作者:王云等
    会议:ICASSP 2023
    [PDF] [代码]
  • 多模态声音识别研究
    作者:王云等
    期刊:IEEE/ACM 语音与音频处理汇刊
    [论文]

其他信息

兴趣爱好

摄影、阅读、编程、旅行

专业技能

  • Python
  • PyTorch
  • TensorFlow
  • 机器学习
  • 深度学习
  • 语音处理
  • 信号处理