code window

2024年5月1日星期三

TTS: 新戰場

Text to Speech arena加入了 OpenVoice v2、PlayHT 2.0 和 Voicecraft 2.0 🔥

記得開聲音 🔔

為什麼選擇它們?

OpenVoice v2 是 myshell ai 最新發布的版本,使用了更多的數據和更好的訓練策略進行訓練,更重要的是,它是以 MIT 授權發布的。

Voicecraft 2.0 是最近由 Puyuan 和德州大學發布的版本 - 這些模型是專門針對 TTS 進行微調的,儘管採用了非許可性的授權。

Play HT 2.0 可以說是 TTS 的最前沿技術 - 它與 ElevenLabs 類似,是封閉原始碼的 - 它只是為了在僅有封閉原始碼 API 的區域中加熱競爭。



沒有留言:

發佈留言

SambaNova SN40L: 利用Dataflow和專家組合(COE)來克服AI記憶牆的大模型

摘要 GPT-4等整體式大型語言模型(LLM)為現代生成AI應用鋪路。然而,大規模訓練、服務及維護整體式LLM仍然極其昂貴和充滿挑戰。現代AI加速器計算能力與記憶體比例的不成比例增長已經造成了記憶體壁障,需要新的方法來部署AI。最近的研究顯示,許多小型專家模型的組合,每個模型參數...