ElevenLabs 发布全新 AI 语音生成工具 Voice Design:通过文本提示创建个性化语音
00 min
2024-10-29
2024-11-26
type
status
date
summary
tags
category
slug
icon
password
公众号
关键词
小宇宙播客
小红书
数字人视频号
笔记
ElevenLabs 发布全新 AI 语音生成工具 Voice Design:通过文本提示创建个性化语音
ElevenLabs 推出了一款创新的 AI 语音生成工具——Voice Design,通过简单的文本描述即可创建个性化的 AI 语音。用户可以根据需求调整年龄、口音、性别、语调、音高等多种特征,以生成生动逼真的 AI 语音,广泛适用于广告、游戏、播客等多种场景。
notion image

核心功能

  • 自定义语音生成:基于文本提示生成个性化语音。用户可以详细描述语音特征,如年龄(年轻、年长)、性别(男性、女性)、口音(美国、英国等)及语调(友好、严肃、兴奋等)。
  • 角色化语音支持:Voice Design 还能生成带有特定角色特征的声音,如精灵、机器人或外星人等非人类角色,使语音风格更具创意和灵活性。
  • 高度灵活性:用户可反复尝试不同文本提示和参数组合,生成符合各种创意需求的语音。
Video preview

应用场景

  • 广告与视频配音:为广告或营销视频提供高质量个性化配音,提高品牌吸引力。
  • 游戏与角色配音:生成游戏角色的独特声音,提升角色个性化和真实感,为玩家带来沉浸体验。
  • 有声书与播客:为多角色对话生成不同的声音,使音频内容更加生动。
  • AI 助手与语音交互:为语音助手赋予特定特征,提高用户交互体验。

操作指南

  • 文本提示输入:用户通过简单的文本描述指定语音特征,Voice Design 将生成相应的语音。
  • 语音调整与优化:可以对生成的语音进行语调、音高、情感等微调,确保语音符合需求。
  • 提示指南与示例:ElevenLabs 提供了详细的提示示例,帮助用户快速上手生成目标语音。

与其他产品的整合

  • 文本转语音:Voice Design 集成在 ElevenLabs 的 TTS 平台中,用户可以将文本转换为个性化语音。
  • 语音克隆与复制:支持录制用户自己的声音进行克隆,适用于配音、播客等多种应用场景。

未来功能与 API 支持

  • API 接口:ElevenLabs 计划推出 Voice Design API,方便开发者集成到应用中,实现大规模个性化语音生成。
  • 实时语音生成:未来将支持实时语音生成,满足实时交互场景需求,如 AI 助手。

Voice Design 使用指南

  • 路径:进入 Voices → My Voices → Add a new voice → Voice Design。
  • 生成流程:每次生成将产生三个语音选项,用户可选择并保存最合适的。
  • 预览费用:按预览文本字符数收费,生成多少样本都仅扣除一次字符数。

Voice Design 类型

  1. 真实语音设计:生成符合指定特征的真实语音。
      • 示例:“一个年轻的印度女性,声音柔和,高音,语速慢而平静。”
  1. 角色语音设计:生成具创意的角色声音。
      • 示例:“一个邪恶的食人魔”,“一个尖声的老鼠”。

语音属性

  • 关键属性
    • 年龄、口音/国籍、性别。
  • 可选属性
    • 语调、音高、语速、情感等。
更多信息请访问官网或查看使用指南
notion image
上一篇
Virtual Try-On虚拟试衣APP!来了
下一篇
教你 5 分钟搭建 AI 应用到微信服务号(无需编码)