即构科技自研KTV实时打分功能 音高线提取精确率高达 99%

国际在线   2023-05-27 17:23:37

爱唱歌的你,是否曾经怀疑过,KTV里到底是不是有一群评委蹲在某个角落,随机地给你出分。

事实上,KTV打分系统并不是一个人工智能,也没有评委蹲在里面,而是一个基于音频信号处理、输出客观数据统计的系统。卡拉OK八十年代开始率先在日本风靡,1982年,日本一家公司推出首款带打分功能的家用卡拉OK机。随着卡拉OK从日本传入亚洲各国乃至全世界,评分系统也跟着漂洋过海,满足了我们对音乐娱乐及互动反馈的进一步需求。不过,让机器给人类的歌声评分显然没有那么容易。传统K歌评分的主要思路是比对旋律特征,当你唱歌时,系统会实时地录制你的声音,并将其转换成数字信号,将你的声音信号和原唱的音轨信号进行对比,计算出你的音准、节奏和音色的相似度。用户演唱的旋律特征和原唱越相似,在机器看来则代表着“音准越好”“节奏越对应”,得分就会越高。做到这些需要三步走:一是KTV打分系统会预先存储好每首歌曲的音轨和歌词,以及每个音符的音高、时长和节奏,根据评分标准提取旋律特征,建立标准模板库;二是通过算法提取被评分的干音(设备采集的未经任何后期处理的人声录音)旋律特征;最后,把两者特征相似度进行量化评估,得出分数。


(资料图片仅供参考)

当然,系统所认定的“高分”演唱在人类耳中并不一定好听。有人总结过“套路”系统获得高分的技巧:录音清晰、歌声音量大、声音平稳、尾音拖长,都可能获得系统青睐。至于音色,声情并茂、气沉丹田?对不起,暂时不在考虑范围内。因此,经常可以听到灵魂吐槽:“我明明唱得很好,为什么分数这么低?!”可以说,大部分KTV打分系统都不是完美的,存在一些局限性和缺陷,比如只能评价你的音准、节奏和音色,而不能评价你的情感、表达和技巧,对于不同的歌曲和歌手的难度和标准可能不一致,因此有些歌曲可能比较容易拿高分,有些歌曲可能比较难拿高分。总之,部分KTV打分系统可能存在一些技术上的误差和延迟,未必能真实反映你的演唱水平。不少演唱者因为分数过低,而被打击了演唱信心。

K歌软件的声音修饰也给了更多人展露歌喉的勇气。年轻人进一步享受在线上展示和交流自己,在线K歌更能满足他们社交+休闲的需求。当娱乐阵地逐渐从线下  KTV 转移至线上,为了真实还原线下 KTV  的娱乐体验,“打分”这一互动玩法在线上同样成为提升受众参与感不可或缺的一项功能。在互联网公司技术实力的加持下,K歌评分已进入2.0时代。这导致的结果是,靠干嚎骗过机器的难度大幅提升了。那么如今这一功能有哪些提升呢?

众所周知,现在很多歌曲人声包含了和声等因素的影响,并且不同音乐的复杂性以及歌曲语料质量参差不齐,使音高线的提取工作相当困难。实时互动企业即构科技近期将自研的KTV实时打分功能集成在了在线 KTV 及实时合唱解决方案中,通过使用AI模型在尽量保证人声完整性的前提下,分离出信噪比较高、保留较完整的人声,即构的算法能从各种复杂的音乐中准确提取音高线,精确率高达99%,快速生成打分标准。

如果只是根据差异做一个线性的评分,对于不同的平台用户的体验未必是最佳的。算法也需要尽可能“读懂感情”,给出更有人情味的评价标准。如何确保唱得好的人能够通过分数获得认可,同时也让部分演唱小白能够得到积极的正反馈和激励,这是在线K歌场景避不开的需求点。因此即构的这套打分策略算法上,对大部分“青铜级”演唱者能够给出一个兼顾自信及保留进步空间的多维度弹性分数,以保护他们的演唱积极性,同时对头部的“王者级”演唱者做到凸显高分,提升其互动竞技性。目前,即构的方案中设置了 5 种演唱难度等级,供平台方在Easy模式和Hard模式中间按需切换选择。

此外,即构的在线 KTV 解决方案中还配备海量正版曲库,收纳 2000 万+首歌曲,热门点唱top 歌曲覆盖率超过 90%,并且对周杰伦等热门明星歌手和抖音等短视频平台的热门歌曲进行了覆盖,更支持动态更新热门歌曲,平台方仅通过一套 SDK 就可迅速实现音乐版权的接入。

即构科技作为音视频技术厂商,将持续以丰富的功能与玩法,不断鼓励用户进行个性化表达,守护音乐的情感价值,让用户在K歌过程中发现自我声音的独特魅力,与众多泛娱乐平台共同为整个音乐行业的繁荣发展提供源源不断的动力。