您的位置:首页 >资讯 > IT >

推动生成式AI更好应用于声音类文艺创作

2024-09-05 15:46:56    来源:经济参考报

声音类产品作为文艺创作的重要表现形式,与生成式AI(人工智能)的结合为文艺创作带来了全新的可能性。通过生成式AI技术,声音类产品在音乐创作、语音合成有声读物、虚拟主播、影像音效制作等方面不断变革创新,为文艺创作提供了全新的创作手段和表达方式。生成式AI技术在文艺创作中的应用为声音类产品发展提供了新的机遇,但面临的风险与挑战也需积极应对和解决。

生成式AI产品应用领域广泛

AI音乐创作“风生水起”。生成式AI技术已经在音乐领域得到广泛应用,主要体现在分类识别(音乐检索、乐谱识别、音频识别)、生成(AI作曲、虚拟歌手)及传播(MIDI音响、教育)这三个方面。AI在音乐创作的不同阶段都发挥了较大作用。在创作初期,创作者运用AIGC汲取音乐素材以及创作灵感,同时对作品的音乐风格进行分析和预测,并进行音乐素材的智能检索和组织。在创作中期,AIGC技术为创作者的作品产出提供支撑,更好地辅助音乐创作,将音乐作品意图具像化。在创作后期,AIGC为雏形作品的后期制作提供强大的音频处理工具,从而使作品的后期制作更加准确、高效。尤其是某些AI编曲技术的出现,为音乐创作者带来更多灵感的同时,也使创作过程更加高效。

AI虚拟主播走近大众。虚拟主播通过运用AI语音合成技术、自然语言处理技术、深度学习技术以及计算机视觉技术走进大众视野。语音合成技术通过先进的语音合成算法,模仿人类的声音,从而使虚拟主播能够流畅、自然地表达交流。计算机视觉技术在虚拟主播的形象呈现方面发挥着关键作用。通过3D建模和渲染技术,可以创建出高度逼真的虚拟人物。同时,通过面部捕捉和动作捕捉技术使虚拟主播能够实时模拟真人的表情和动作。情感计算技术可以分析观众的语言和行为,判断观众的情感状态,据此及时调整虚拟主播的回应方式及语气,进而赋予了虚拟主播在交互状态下的情感变化。

AI配音应用广泛。AI配音技术通过对大量语音数据进行学习,能够模拟出不同人物、不同情绪的语音特点,为AI配音产品提供丰富的角色表现和情感表达。随着AI技术的发展,神经网络、深度学习等技术出现,“TTS+AI”(从文本到语音+人工智能)的组合使得电子合成语音自然性和准确性不断提高。针对情感起伏、声线多元、人声适配度等多样化需求,目前已有AI语音产品供应商提供“情感TTS”定制服务,通过调整语音语调、语速、停连、音高甚至模拟人类在不同心情下的语气变化,使电子合成语音能够更贴切地适应不同的语境和场景,赋予其更为丰富的“情感”表达。AI配音技术应用场景较为广泛,对众多行业发展都有促进意义。在电影、电视剧、动画等影视作品中,AI配音技术被用于生成角色的语音。通过模拟不同音色和语言,AI配音技术可以使角色声音更加自然、真实,提高观众的观看体验。该技术在有声读物和电子书领域也应用甚广,为用户提供更加自然、流畅的语音播报服务。AI配音也被应用在游戏领域,可以生成自然且更符合角色设定的声音,增强了游戏消费者的体验。

生成式AI产品优势明显

创作成本相对较低。随着人工智能技术的发展,AI技术开始尝试应用于智能声音设计,即自动根据影视内容及情感要求生成相应音效,这一应用大大降低了制作成本。一方面,节省了声音类产品制作的时间和人力资源。相较于传统产品,AI技术的应用可以快速生成出所需声音,并实现自动化操作,减少了创作过程所需的人力和时间。另一方面,传统声音类产品制作容易受到多种因素影响,例如创作者的状态、环境噪音、设备操作等,导致创作周期较长,而生成式AI技术应用到声音类产品创作中可以最大限度降低外界因素影响,实现成本最优化。

素材处理精准高效。AI技术通过大量的数据学习,可以对音频素材进行识别、分类、整理,自动识别音频中如人声、音乐、音效等不同元素,并进行快速分类和整理,与人工相比大大提高了素材处理的质量,降低了数据处理的错误率。AI技术还可以对音频素材进行智能剪辑和拼接。此外,在音频处理过程中需要经过降噪、增减混响等特殊处理,人工处理可能存在个体偏差,而AI技术能最大限度降低错误出现的概率。

生成内容多元新颖。随着社会发展,人们对声音类产品的需求更加多元化、个性化。针对此现状,生成式AI可以帮助创作者在广告配音、音乐制作、虚拟角色声音等多领域的创作中打破固有思维限制,提供新颖的创作思路。不仅如此,AI能够通过分析用户的喜好、习惯和交互数据,了解用户对声音产品如音色、语气、语调等方面的具体需求,为创作者个性化创作提供实际支撑。

生成式AI产品发展存在的风险与挑战

权益问题存在争议。声音类产品涉及数据侵权风险、版权主体的权益以及个人隐私和人格权等问题。AIGC创作模型大多是由庞大的样本训练而成的,对模型选取的素材进行反向溯源难以实现,而采用的素材可能未经作者授权。不仅如此,生成式AI的使用者可以在生成的产品上进行二度创作,新产品版权的归属问题也难以确认。AI在生成部分声音类产品时,如使用到未经公开发布的普通人的声音,这类声音属于个人隐私信息,在公开发布时可能存在暴露隐私的风险,这将对个人隐私权和人格权造成侵犯。在当前发展阶段,AIGC从组合型内容创造转向探索型甚至变革型内容创造,其创作过程中的权益收益以及可能导致的侵权责任如何划分,目前也处于争论之中。

艺术规范问题存在争议。声音类AI产品涉及音乐、播音主持等艺术类学科,这些学科在其专业领域也有一定的专业规范和艺术化处理方式,而声音类AI产品在是否符合专业的艺术规范方面存在争议。以播音主持专业为例,在不同语境下朗读时,同一句话所表达的语气、情感、停连、重音都是不同的,说话时停连、重音的位置变化也会影响意思表达。但目前,生成式AI在配音时不能根据文本内容识别具体的语境,同一声音在不同语境下朗读方式区别不大。在情感处理方面,AI与真人相比表达较为生硬,没有情感起伏。因此,在实际应用中,声音类AIGC产品在艺术规范方面的问题也值得深思。

生成式AI产品对创作者的启示

创作者应不断提升自身能力。生成式AI技术可以实现一键生成,一些简单重复的工作不再需要人工完成,这就使一些创作者面临失业风险。当然,声音类AI产品存在的固有问题也使优秀创作者的地位不可撼动。例如,AI虚拟主播能够通过“克隆”方式模仿规范的普通话和特定音色,但究其根本也只能模仿声音的外在形式。实际上,优秀的主播需要在不同情境下采用不同的播报方式,通过语气、语调、停连等的变化来表达不同的情感状态。这就要求创作者们不断提高自身技术水平,提高专业能力,综合学习多领域知识,丰富自己的阅历,扩大自己的优势,从容面对AI产品发展对创作者产生的冲击。

创作者应合理利用AI技术。AIGC技术发展到现阶段,其在为创作者提供创作灵感、降低创作成本、提高作品产出效率、提升作品质量等方面具有一定的优势。因此,创作者要主动了解和学习AIGC技术,不能一味地肯定或者抵制,而是要将自身需要与AI技术相结合,掌握在AI技术运用当中的主动权,使其成为辅助作品创作的得力助手,实现自身与AI技术双向融合发展。同时,因AIGC的使用规范问题还存在争议,创作者要提高自身法律意识,及时了解AIGC相关法律法规,使AI技术能够在合理规范的情况下辅助自身创作,提高作品质量,产出更优秀的声音类产品。

随着AIGC技术的发展,其在声音类产品方面的应用已经占据了一定的位置。其不仅能模拟出接近人类的声音,直接生成声音产品,而且可以辅助创作者进行创作,为创作者提供全新的工具和独特的表达方式。但同时,生成式AI技术在声音类文艺创作应用中仍面临诸多挑战,我们要在抓住机遇的同时正视存在的问题,并在实践中努力加以改进,让生成式AI技术得到更好更广泛的应用。

(作者单位:苏州大学传媒学院)

标签:

相关阅读

精彩放送

中非同携手 共赴现代化丨播撒光明 一场“看不见”的白内障手术

坐游船 看露天电影 赏传统戏曲 这是水韵古村里的美好夜生活

新校舍投入使用 甘肃积石山各学校“开学第一课”以“感恩”作为关键词

为什么要加快打造绿色低碳供应链

筑起促进数实融合的“四梁八柱”

数据驱动机制创新 金融助推科技之花结"硕果"

可穿戴设备不断出新 消费电子行业景气度持续提升

机器人产业大步迈向高质量发展

我国科学家在超高纯石墨领域取得重大突破

新研究:新西兰数个本土物种生存史较此前认知更为悠久

AI工具精准描述细胞代谢状态

超宽带太赫兹偏振复用器问世

新技术为“发烧”城市降温

最新进化的脑区更易衰老

耐500℃高温超坚固碳塑料制成

醋蒸法可提升紫外线传感器响应速度

口腔棒状杆菌以多重裂变方式繁殖

RNA杀菌剂:“鱼与熊掌”可兼得

构建人工智能框架找到最有效溶菌酶

新型大豆蛋白基水凝胶研制成功

各地加码支持以旧换新,消费者享惠如何升级?

“京西有惊喜 ‘惠’购好车季” 第三期石景山区汽车消费券活动再度开启

同仁堂科技2024年上半年营收净利双增长 多重因素助推公司高质量发展

从沪明医疗三个“一”看对口合作新探索

甘肃加强种质资源保护 繁育更多好药材

法润齐鲁绘就和美乡村新画卷

重庆綦江:老工业基地向绿而行低碳发展

浙江富阳:共富工坊 带富一方

云南加大生态环境保护力度

深圳加快构建换电服务网络

邸东东 王琳:我们一起跳过黑暗束缚 跃向梦想彼岸

下好生态保护“一盘棋”

人“旺”财“不旺” 网红城市如何转化“泼天流量”?

市场监管总局组织实施一批制造业国家计量比对项目

8月份我国物流业景气指数为51.5%

见证地球演化史!我国新增3个世界地质遗产地

新增4项!38项世界灌溉工程遗产彰显我国治水智慧

“蛟龙号”从5500米深海带回黑珊瑚及海百合幼体

上海大力推进消费品以旧换新

甘肃积石山县全面完成受灾学校维修重建项目

暑运旺季中国民航旅客运输量创新高 支线航空热

中国科研团队研发出国际领先的超高纯石墨

中国再添4个世界灌溉工程遗产

民政部:今年上半年共实施临时救助417.7万人次

中国成功发射遥感四十三号02组卫星

中国海上最大油田原油日产突破10万吨

暑运旺季中国民航旅客运输量创新高 支线航空热

受台风“摩羯”影响 5日至7日北海至涠洲岛航线停航

多地商贷利率进入“2时代” 公积金吸引力还有多大?

生产供应有保障!全国蔬菜价格进入季节性下行区间

广东:珠江口以西海域渔船4日12时前回港避风

壮族爱情信物赶新潮 小绣球闯出大市场

广西绣球之乡:巧绣民族情 共筑致富路

中亚及土耳其媒体代表走进新疆伊犁

台风“摩羯”7日将进入北部湾 船只及人员需返港避风

暴雨来袭!自然资源部对四地启动地质灾害防御Ⅳ级响应

国家防总针对广东海南启动防汛防台风四级应急响应

湛江启动海上防风Ⅳ级应急响应 琼州海峡客滚船将停运

福建寿宁筑巢回引“新农人” 助力乡村人才振兴

广州市民: “在‘大巴扎’里逛一逛,我的心已飞到了新疆”

“暖城之约·领步山河·探索文明”2024第二届乌审旗萨拉乌苏徒步大会

提督TIDU携手厨神小当家,联名料理满足童年情怀

君乐宝魏立华获河北省科学技术突出贡献奖终身荣誉

“迪奥倾世之金”(L'OR DE DIOR)展览于2024年9月2日至29日瞩目亮相北京嘉德艺术中心

商务男装卖不动,雅戈尔们寻路年轻化

网上“攒金珠”靠谱吗?“迟到”的金珠套路深

世上唯一的金属绣!感受苗族锡绣背后的时尚密码

“汉服经济”开拓百亿市场

江南布衣亮相“ESG-可持续创变”主题展 持续探索中国原材料绿色未来

被之禾收购六年后,法国女装品牌Carven举步维艰

直播式微短剧风起 国产美妆企业排名大洗牌

实探金店“联名热”:年轻化趋势助力业态升级

马甲、刺绣外套……秋装上新了 国风款引领时尚 走俏市场

“旅行+”内涵再升华,捷途山海L6正式上市

车网融合互动前景广阔

超八成汽车行业上市公司上半年盈利

丰田汽车在安全测试丑闻后重启三款车型的生产

哪吒遇冷、创维成谜,理想领衔8月造车新势力

我眼中的成都车展:二线高档分化,“卖车”成主旋律

滴滴的“造车梦”仍在继续

通用推迟3.3亿美元锂矿额外投资

现代汽车公司8月全球销量同比下跌5.3%

通用汽车将永久关闭厄瓜多尔工厂,并解雇320名工人

云南晋宁:一枝鲜花背后的科技力量

三方协作助力重庆空天信息产业“四地”建设

近八成消费电子上市公司上半年盈利 抢抓机遇加码布局AI领域

做芯片应用产业引领者

隐私计算护航大数据安全流通

美国拟就加拿大数字税展开贸易争端谈判

2024年国家网络安全宣传周将于9月9日至15日举办

非洲数字化进程:“多点开花”,机遇与挑战并存

数字化提升保险业服务水平

中科星图深耕空天信息服务领域 给地球定制数字化“外套”

真菌和计算机组合机器人问世

五万个人类结状DNA现“真容”

利用尖端技术 培育“超级果蔬”

世界上最大风帆货船绿色环保

导电性3D打印植入物促进受损脊髓修复

啮齿动物在黑暗中如何自如穿行

罹患糖尿病会加速大脑衰老

院企合作再深化 百洋携手阜外医院共建联合研发中心

释放价值,向“新”求变——唐金出席数字资产与产业赋能高端论坛

天空地立体监测:精准“把脉”黑土地质量

国内首台商业化体积生物打印设备发布

植入式生物电子器件柔软“贴身”不怕水

环氧树脂浇注干式变压器实现高效降解

数字射线检测技术给压力罐做“体检”

新材料可延长质子交换膜电解槽制氢寿命