如何判断这首歌是否是人工智能制作的
这篇文章是Lifehacker“揭露人工智能”系列的一部分。我们正在探索六种不同类型的人工智能生成的媒体,并强调常见的怪癖,副产品和标志,帮助你区分人工和人类创造的内容。
在所有人工智能生成的内容中,人工智能音乐可能是最奇怪的。让电脑从零开始创作一首完整的歌曲,就像让ChatGPT帮你写一篇文章一样,这似乎不太可能,但它确实可以做到:像Suno这样的应用程序可以根据一个简单的提示为你创作一首歌曲,包括人声、乐器、旋律和节奏,其中一些内容太有说服力了。这项技术越好,当你偶然发现人工智能音乐时,就越难发现它。
事实上,这已经很困难了。当然,有一些例子是显而易见的(尽管它们很好,但没有人认为浮游生物真的会唱所有这些翻唱),但有很多人工智能生成的歌曲肯定会欺骗普通听众。已经听起来像数字的器乐电子音乐尤其难以辨别,并引发了许多道德问题,以及对音乐产业未来的担忧。
然而,让我们先把它放在一边,专注于手头的任务:当你在野外听到AI音乐时,找出它。
你可以用文字描述一首歌,并让人工智能工具生成一首完整的歌曲,包括人声等等,这似乎有点神奇。但实际上,它是机器学习的产物。
与所有AI生成器一样,AI音乐生成器也是基于经过大量数据训练的模型。这些特定的模型是在音乐样本上训练的,学习不同乐器、人声和节奏之间的关系。例如,制作人工智能封面的程序是根据特定艺术家的声音进行训练的:你提供足够的艺术家声音样本,程序会将其映射到你试图复制的人声轨道上。如果这个模型训练得很好,你给它提供了足够的声音数据,你就可以创造一个令人信服的人工智能封面。
这是一个过于简化的解释,但重要的是要记住,这些“新”歌曲是由大量其他声音和歌曲组成的。无论整首歌是由人工智能生成的,还是仅仅是人声,支持这项技术的模型都是根据之前的训练输出产品。虽然这些输出中的许多都令人印象深刻,但如果你仔细倾听,你可以从中发现一些一致的怪癖:
大多数生成式人工智能产品都有一些人工制品或不一致之处,可以暗示它们的数字起源。AI音乐也不例外:AI模型生成的音频有时听起来非常有说服力,但如果你仔细听,你可能会听到一些奇怪的声音。
比如这首Suno的歌,“我没有一分钱,我没有一毛钱。”这种人工智能输出应该会吓到你,因为它可能会欺骗很多人,让他们相信这是真的。但把注意力集中在声音上:整个过程中,“歌手”的声音都是颤抖的,但不是你想象中人类的声音。它在调制,几乎就像在自动调谐,但听起来更像机器人,而不是数字修改。一旦你掌握了听这种声音的技巧,你就会在很多人工智能歌曲中听到它。(不过,我不情愿地承认,这首歌的副歌相当朗朗上口。)
这是另一个例子,“石头”,这可能比上一个更可怕:这首歌中有几次,特别是“我知道,但我该怎么办”这句话听起来非常现实。但就在这句话之后,你可以听到一些与上面相同的调制问题,以“哦,我的爱”开始。不久之后,出现了一个奇怪的故障,听起来歌手和乐队都唱错了音。
也许更能说明问题的是,第二个“合唱”分崩离析。它有相同的歌词,直到“我知道,但我该做什么”,但中途过渡到“我知道,我有一天”,变成了另一节的歌词。此外,AI似乎不记得最初的合唱是如何进行的,所以它创造了一个新的曲调。第二次尝试远不如第一次那么逼真。
这是一个相信你的直觉:有太多的人声是用数字工具编辑的,很难区分这些小故障和调制与真实的人声。但如果有什么东西听起来有点恐怖谷,那可能是机器人在唱歌。
如果你有现代的流媒体服务和一副好的耳机,你可能已经习惯了高质量的音乐播放。另一方面,人工智能生成的音乐通常是经典的mp3声音。它不脆;相反,它通常是模糊的、细小的、平坦的。
你可以从Soundful提供的大多数样本中听到我的意思:点击选项,虽然你可能不会犹豫在YouTube视频的背景中听到任何声音,但请注意,没有一个特别清晰。大声的样本是高一点的质量,但仍然遭受同样的效果,好像每条轨道被压缩成一个低质量的格式。即使是Suno的许多歌曲,这些歌曲可以说是目前最好的全能人工智能歌曲,听起来也像是从Napster下载的。(尽管他们似乎正在琢磨低音降的问题。)
显然,有一种真正的低保真音乐类型,它的目标是“低质量”的声音。但这只是判断一个曲目是否由AI生成时需要注意的一个线索。
AI也许能够生成人声,甚至是相对真实的人声,但它们仍然不是完美的。该技术仍在努力制作具有现实差异的人声。你可以称之为缺乏激情。
听听这首歌,《回到起点》它的声音有一般的机器人的声音,但它也没有真正去任何地方。大部分歌词都是用同一个音调唱出来的;罂粟色和浅色,当然,但有点压抑,几乎无聊。
这是人工智能输出正在改善的一个领域:Suno正在产生一些具有逼真变化的声音(尽管并不总是如此)。就连痞老板在痛骂查普尔·罗恩时,声音里也充满了激情:
另一件需要注意的事情是,在人工智能歌曲中,歌手听起来“上气不接下气”,因为很多词听起来都不太清楚。我不确定是什么导致了这种现象,但这是我从许多人工智能歌手身上注意到的。听听可怜的弗兰克·辛纳屈(Frank Sinatra)在报道杜瓦里帕(Dua Lipa)时挣扎着说出的每一个字:
当我写关于AI的文章时,我发现自己在重复一个特别的观点:AI实际上并不“知道”任何事情。这些生成模型被训练来寻找关系,它们的输出是它们所学到的这些关系的结果。
因此,这些歌曲并不能证明人工智能确实知道如何制作音乐或音乐应该如何运作。这并不能使他们成为优秀的词作者,或者是写旋律的专家。相反,它根据之前的训练产生内容,没有任何关键能力。现在,这样做的结果是,最终的产品往往是令人信服的第一次听,但如果你再听一遍,或者有一个敏锐的耳朵,事情可能会分崩离析。当你看到一首你认为可能是人工智能创作的歌时,想想这首歌的不同元素:这些歌词真的有意义吗?音乐是否以一种合乎逻辑的方式流动?
你不需要成为音乐专家就能学会这些东西。想想上面的“石头”的例子:Suno似乎已经“忘记”了最初的副歌应该怎么唱,事实上,最终搞砸了它早期建立的歌词。第一节的旋律也很混乱,尤其是那句奇怪的“不想你”。更不用说,这首诗很短,几乎马上就转到了副歌部分。这首歌对AI来说非常“好”,但这并不能让它成为一首“好”的歌。
人工智能明星的翻唱令人印象深刻,而且听起来往往就像他们所模仿的歌手。但这首歌使用了一个著名的声音这一事实本身就可以成为一个线索:如果泰勒·斯威夫特翻唱了塞布丽娜·卡彭特,这将是一个新闻,而不是包含在YouTube视频或Instagram上。如果一个主要的艺术家推出了真正的音乐,你可能会在像Apple music或Spotify这样的流媒体平台上找到它,或者至少从艺术家那里得到一些证明,他们确实录制了封面。
相关文章
最新评论