LightClone: Speaker-Guided Parallel Subnet Selection for Few-shot Voice Cloning

Authors: Jie Wu, Jian Luan, Yujun Wang

Emails: {wujie9, luanjian, wangyujun}@xiaomi.com

Abstract:



Note: Please ensure your web browser supports wav audio format. You can choose Microsoft Edge, Google Chrome, Firefox, Opera and Safari.


MOS Scores for Voice Quality and Speaker Similarity


Audio Samples

Male Speaker 1:

Recording
Text 1. 找到以下应用,请问你需要打开第几个?
Base-lowerBase-upperSG-PSSDSG-PSS
Text 2. 星星在天上,你在我心里,星星是夜空的,而你是我的。
Base-lowerBase-upperSG-PSSDSG-PSS
Text 3. 晚安,愿你喜欢的人到梦里见你哦。
Base-lowerBase-upperSG-PSSDSG-PSS
Text 4. 厉害了,这个问题我要花时间想想,先说点其他的吧。
Base-lowerBase-upperSG-PSSDSG-PSS

Female Speaker 1:

Recording
Text 1. 星星在天上,你在我心里,星星是夜空的,而你是我的。
Base-lowerBase-upperSG-PSSDSG-PSS
Text 2. 爱你,有啥事直接和我说吧。
Base-lowerBase-upperSG-PSSDSG-PSS
Text 3. 晚安,愿你喜欢的人到梦里见你哦。
Base-lowerBase-upperSG-PSSDSG-PSS
Text 4. 点击下方的自定义场景,可以定制个性化的内容哦!
Base-lowerBase-upperSG-PSSDSG-PSS