Инструкция по работе с инструментом «Диктор»

Инструмент Text to speech в GPTunneL™
Irina Yanakova
Product Manager

Инструмент «Диктор» позволяет пользователям синтезировать речь на основе текста, используя различные голоса, стили и настройки, которые можно адаптировать под конкретные потребности.

Примеры применения инструмента «Диктор»

  • Подкасты и аудиокниги: Авторы или издатели могут преобразовывать текст в аудиоформат, выбирая подходящий голос и стиль чтения.
  • Видео-контент: Создатели контента могут добавлять закадровый голос к своим видео, не прибегая к услугам профессиональных дикторов.
  • Обучающие курсы: Преподаватели и создатели онлайн-курсов могут озвучивать лекции и учебные материалы, делая их доступными для аудиального обучения.

Как использовать инструмент «Диктор»

  1. Выберите голос

Интерфейс предлагает широкий выбор голосов, разделённых на две категории:

Выберите голос понравившегося диктора для озвучки вашего текста
  • Голоса нового поколения: Это более высококачественные и выразительные голоса, которые могут быть использованы для различных типов контента (рассказы, новости и т.д.). В данной категории можно найти голоса с различными уровнями стоимости (например, $$$ обозначает более высокую стоимость генерации).
  • Бюджетные голоса: Эти голоса предлагают более доступные варианты с меньшими затратами на генерацию. Несмотря на более низкую стоимость, они по-прежнему подходят для множества проектов.

Для выбора просто кликните на понравившийся вам голос.

  1. Введите текст

В текстовое поле внизу экрана введите текст, который вы хотите озвучить.

Правильно расставленные ударения помогут диктору более точно и естественно произносить текст,

Для улучшения качества произношения вы можете использовать функцию «Поставить ударение». Эта опция позволяет вам вручную указать правильное ударение в словах, где это необходимо.

  1. Настройте параметры

После выбора голоса и ввода текста, вам будут доступны различные настройки в зависимости от типа выбранного голоса.

Расширенные настройки, доступные только для голосов нового поколения

Стабильность: Этот ползунок управляет степенью вариативности речи.

Чем выше стабильность, тем меньше изменений будет в интонациях и темпах речи, но могут сделать звучание текста немного монотонным. Низкие значения делают речь более выразительной и эмоциональной, но могут привести к нестабильности.

Для длинных фрагментов текста рекомендуется уменьшить это значение.

Ясность и схожесть: Регулирует, насколько близко синтезированная речь будет соответствовать оригинальному голосу. Чем выше показатель, тем более точным будет соответствие оригиналу.

Стиль: Настройка стиля позволяет добавлять выразительные элементы в голос. Например, вы можете выбрать преувеличенный стиль для более эмоциональной подачи или оставить стиль нейтральным.

Улучшение диктора: Эта опция повышает сходство синтезированной речи с голосом диктора за счет снижения скорости генерации.

Важно отметить, что эти расширенные настройки доступны только для голосов нового поколения. При выборе бюджетных голосов, вы сможете использовать базовые настройки для генерации речи.

4. Отправьте готовый текст на обработку

После обработки, аудиодорожка появится в истории ответов, где вы сможете поделиться ссылкой на аудиозапись или скачать в формате MP3.

Результат синтеза речи на основе текста


Рекомендации по улучшению качества синтезированной речи

Чтобы сделать синтезированную речь более естественной и выразительной, воспользуйтесь следующими приемами:

  • Управление паузами: Используйте запятую «,» для короткой паузы между словами. Две запятые «,,» создадут более длительную паузу. Длинное тире «—» заставит нейросеть выдержать значительную паузу.
  • Расстановка акцентов: Напишите слово ЗАГЛАВНЫМИ буквами, чтобы нейросеть произнесла его чуть громче и с акцентом. Добавьте восклицательный знак «СЛОВО!» для усиления эффекта.
  • Изменение интонации: Вопросительный знак «?» в конце предложения изменит интонацию на вопросительную. Три вопросительных знака «???» создадут более выраженную вопросительную интонацию.

Совет. Для достижения наилучшего результата, прочитайте текст вслух самостоятельно. Отметьте места, где нужно сделать паузу, выделить слово или изменить интонацию, и примените соответствующие приемы форматирования.


Итак

Инструмент «Диктор» в GPTunneL™ — это мощный способ быстро создать высококачественную дикторскую речь для любых целей. Не бойтесь экспериментировать с различными голосами и настройками. Пробуйте разные комбинации, чтобы найти идеальное звучание для вашего проекта!

Перейти в ChatGPT