网站首页科技创新亚马逊平台语言(亚马逊文字转语音)

亚马逊平台语言(亚马逊文字转语音)

科技信息网 2024-06-20 02:16:40 科技创新 296

据外媒2月18日报道，亚马逊人工智能研究团队宣布，他们开发出了史上最大的文本转语音模型。所谓“最大”是指拥有最多的参数、使用最大的训练数据集。

外媒报道称，这款名为BASETTS的新模型拥有9.8亿个参数，是同类产品中最大的，在规模和能力上超越了之前的迭代。它使用100,000小时的录音进行训练，其中大部分是英语语音，但也包括德语、荷兰语和西班牙语，使其成为自然语音的新标准。

亚马逊平台语言(亚马逊文字转语音)

研究人员表示，尽管遇到了文本转语音引擎固有的困难，例如发音错误或语调错误，但该模型表现出了处理复杂语言结构的卓越能力。

研究人员进一步指出，与之前的文本转语音模型相比，该模型提高了单词的发音质量。

据外媒报道，这一突破标志着文本转语音技术的发展向前迈出了重要一步，该技术可能在不久的将来得到广泛应用。

不过，该团队表示，为了避免滥用，BASETTS不会向公众发布。相反，他们计划将其用作学习应用程序。

相关推荐：

轻生活科技语音芯片,轻生活科技语音芯片是什么

猜你喜欢