直接上链接:
(相关资料图)
链接:https://pan.baidu.com/s/1k6WZ61Op2um1IiJsmjMdvQ?pwd=0720
提取码:0720
以下内容在压缩包的txt文本里都有
首先声明本录音表只是我个人使用的录音表,分享出来而已,不要有太高的要求
其次,我放弃任何权利,你随便怎么弄都行,帮我修复BUG谢谢
然后要重重的说明当前版本0.4版本,没有示范音源,也没有测试过可行性,所以说谨慎录制
PS:如果你测完了,发现了问题,上报给我谢谢,然后我把你挂在这里当示范音源,谢谢
然后本录音表是一个针对偏说话腔的风格化录音制作的录音表,如果你是想录唱腔最好是别用这个表,会有很多录音浪费可能。
文件预览:共2305行录音,2723条oto
1.read me,共2243行录音.txt
录音方式:
顺序:CV.txt→VC.txt→VV.txt→扩充.txt
或CV.txt→扩充.txt→VC.txt→VV.txt
名词解释:
CV:是歌声合成中,每一个字的开头部分 和 每一句的开头第一个字 的采集
VC:是歌声合成中 每一个字 的 结尾部分 到 下一个字辅音 的采集
VV:是歌声合成中元音到元音的采集
扩充:扩充录音部分
本表音素采集:
CV只采集前两个音
VC只采集第二个音的结尾和第三个音的开头
VV只采集第二个音的结尾和第三个音的整个音
扩充只采集第二个音的结尾
录音注意:
录音表中存在一些可能不存在的音或者生僻的音,按照标准的元音和辅音发音录制即可
VV部分请将最后一个音,请根据录音习惯,拉长一些,因为要采集
扩充中的R表示空白,用做采集每一句的结尾音
录音表中的1是用作提示录音者一段录音的结束
录音注意2:
本表支持说话腔,和半说话腔录音,同时也支持特殊咬字,也支持正常唱录
特色就是对说话腔和半说话腔有很好的兼容
对唱录也较为自然流畅
是很好的高质量音素采集录音表
特殊:
如果CV部分使用哈鲁式三字录法,也完全可以
避坑:
本表录音量较大,不适合新人使用,新人建议找录音量更小的录音表录制
如果你对音源质量没有极致的追求,并且你也不理解为什么这样采集,请选择录音量更小的录音表
oto制作:
注意:
如果没有制作经验,请找一个有经验的协助你完成音源制作
其实并不难,只是细节操作比较多,弄不好,就跑不通
或者说你找一个中文cvvc音源,
看别人的oto是如何放置的,看别人的音源信息怎么写,看别人的presamp是怎么放置的
CVVC的oto标记请根据自己音源情况,进行实验后,再进行标记
(制作oto需要有调教经验,如果你甚至都没用过utau,都不知道怎么用,那建议委托给别人
或者先了解utau的使用方法与合成原理,再考虑进行标记)
本表暂时不能提供参考音源
制作方法:
本表提供了oto模板
但由于您的BGM曲速是未知的(甚至你可能拿去录了连呼)
所以请使用:记事本→编辑→替换
将后缀【,左边界,固定,右边界,预发声,重叠】
变更为【,对应数值,对应数值,对应数值,对应数值,对应数值】
请在setParam.exe中定位五条线的位置,再把数值批量替换,制成模板
需要制作的oto:
CVoto或CVoto2(二选一,看个人喜好进进行选择)
VCoto
VVoto
扩充oto
最后:
本表制作参考了大量现有的拆音表,在这里说一声感谢!
本表制作者小白菌已经放弃了所有权力,您可以随意修改,参考,二次发布。甚至您可以商用等等。
【新建文件夹】内有完整的制作流程产物,修改需要一定的能力,请使用【Execl插件:方方格子】和【notepad++】进行修改更为方便
要点:Excel可以快速的将文本转换为表格,方便进行批量处理,方方格子可以根据规则批量替换内容,还支持一系列复杂操作,notepad++可以快速的使用\n进行字符替换换行
使用这三个个工具,就已经足够你完成大部分utau音源制作流程了
当然【python】的功能更强大,但是不够方便,且学习成本较高,如果能掌握,对于大量的数据处理能力,会更上一层楼,有余力的utau音制先生可以考虑学习
小声:仅仅utau就已经快把我熬夜熬死了,我没时间学,不能给你们做全自动工作流了
碎碎念:
请快快来代替我更新吧,可能会有BUG,更多引擎的字典,我也没空做啦,V#我用阿学老师的开源工具自动转换了一个。
2.新人录音建议.txt
首先这个表不推荐新人使用,然后希望你是老手,当然你都看到这里了,说明你很想录这个了,那么教你快速避坑。
一些让新人录音也能变得不那么难听的技巧
如果你唱歌本身就很差,那么请这样录
如果你想录唱腔,建议你就录risku式CVVC就好了,那个录音表只要你录对了发音,就是很标准的唱腔。
如果你唱歌不好听那么请:
1.辅音一定不要录得含糊不清,要用力咬清楚,一般比较长的辅音都会比较悦耳。(但是像s,ch,这种连续的清辅音,别断开,像y和w这种浊辅音的话,允许辅音音量比较小比较长的,这个完全不影响,只要不是彻底断开。录得想要清晰,录长一点就清晰了)
PS:不要太在乎连贯性,你只要是cvvc,字与字没有断的超级开,那么肯定是不会不连贯的鸭。
(也希望一些音制不要把人家的d,g辅音切的那么短了,切长会有杂音是会有,但是太短的辅音无参真的好难受)
PS:也建议音制对openutau进行适配,utau是常用的,但其实我平时都直接用openutau无参偷懒。utau拆音方法也很多,但只要适配openutau那么autocvvc也同样不会出错的
2.元音不要断开读,连读,连读是会音色模糊,但也没有什么办法。
在开头的元音(a,i,u,e,o,ei等等)可以录出一点气泡,意思就是要用力咬清楚,这样音色会更好听。
3.韵腹(ang的a,eng的e等等) ,尽量不要介于中间态。
4.这个录音表本身音素划分的很细,所以说即使是你用咬字腔去录,也不会有问题。
但是请你统一一下你的口型,比如同样是a,那么ba的口型就要保持跟其他a一样。
但是可以看看【presamp】里面的音素划分,ua和a不是一个音
所以即使你的ua录得非常的ua,也没问题,但你要保证在ua之内,你的口型不能忽大忽小!!!
如果发音口型很崩坏很随机,那么就算是辅音咬的很清晰,元音也会很奇怪。
5.不用在乎【presamp】里面的辅音的音素划分,按照你的喜好录就行。
辅音没有划的很细,因为其实已经够用了,而且要划分的很细,那么能分的太细了,录音量还得+++。
PS:一般来说划分更多辅音更多,是为了控制前一个元音的结束音的口型的,因为辅音类型也就那么多,但chuang和chang同样都是ch为辅音,但是因为后面跟随的元音不同,所以前一个音结束的口型和辅音的声音,也有不同。所以就会划分开来。但是例如cheng,chuang,chang,等要划分好多个音素了,像h行的音ha,hang,huang,hao,hou,每个都不太一样,越划越多,暂时不划了。每个人习惯也不一样,定制也不太现实,对说话腔音源,影响没那么大就不划了。
6.如果有能力的话,就在元音稳定的基础上去半唱录,让自己去以一种不累的状态发声。
辅音的音色更取决于先天条件(气流穿过你的身体所产生的一系列事情),但元音的音色更多是共鸣发声,但其实只要你能够把辅音咬清晰咬准了,大概率你的元音也不会太难听。
6.这个辅音清晰,其实可能你不会唱歌和配音的话,是不太懂是一种什么感觉,辅音能够真正清晰的情况下,大概率你的元音咬字和发音也不会出问题。(我思考了一下,基本上没有什么唱法,是会要求你辅音读的很模糊不清的。(划掉)
所以说如果你实在是觉得自己录不好,就去找配音教程或者练一练唱歌,找找共鸣。
虽然我没学过配音,但是我觉得配音可能学起来更系统一些,唱歌太杂了,通过配音教学找到了发声和共鸣的感觉,并且咬字也清晰准确了,那么录一个好的音源你还差什么呢?什么都不差了。
而且你还能混混什么绘圈之类的,多养几个孩子(不,不要鸭,你是来做音乐的)
7.按照辅音清晰,同类元音 口型 发音 稳定的思路去录制音源,基本上不会出错。
如果你想录唱腔:
其实唱腔就按照自己唱某种类型的曲风,会怎么唱,去设计一下自己每个音阶要用什么样子的发音咬字。那么你就可以录了,还是推荐risku式CVVC。较少的元音类型划分,能帮你校准唱腔发音(划),录音量也比较少,直接去录制八字表即可。
我这个方案主要是针对风格化虚拟歌手的,录音量大,但声音会更加自然准确。也更好录。唱腔录这个的话,你的一些采样可能会雷同,导致有浪费产生。
当然我这个字典可以完美向下兼容risku式CVVC,所以说你可以只录risku式CVVC中有的音素。这就需要自己修改录音表了。
而且这个表本身。。。不是为配布做的准备。
上一篇 : m10螺距标准(m10螺距)
下一篇 : 最后一页