He used AI to hold a music festival with the theme: Don’t study for a Ph.D.
他用AI办了个音乐节,主题:别读博
凤凰网科技
ifeng
Document Text
6,343 characters
邓思邈 发自 凹非寺<br>
量子位 | 公众号 QbitAI<br>
一个博士生连续做了6小时实验后,凌晨3点才吃上晚饭——<br>
他打开了一首AI生成的歌,开始单曲循环。<br>
听着歌词里的“被抢一作”“延毕”“审稿不通过”“创新点都没有”“科研理想”,他又哭又笑,眼泪止不住地往下流。<br>
那些他在组会上咽下去、在导师面前没敢说出口的话,无奈、恐惧、焦虑、疲惫……全在这首歌里。他突然感觉自己被看见了,被理解了。<br>
就这么一边听着歌,一边把实验做下去。直到窗外泛白,他才记起来自己一夜没睡觉。<br>
他不是一个人。<br>
就是这样42首歌组成的“不读博音乐节”系列,在B站上收获超5000万次播放,376.4万次点赞。<br>
自动播放<br>
△参考文献:少女时代.《Gee》EP, 2009.<br>
为了用AI做出这样一首满意的歌,作者抽卡次数多的时候可以生成100多个版本。<br>
没人知道他的真实身份,但却有3000多封信写给他表达感谢:<br>
你不是站在岸上呼喊的人,而是会跳下水,和我们一起感受在水里挣扎浮沉的感受。<br>
接下来,你将会看到一个被迫停下来的科研人,在停下来的时候,做出了让别人得以喘息的东西。<br>
他创作出这些歌词和旋律,原本是为了治愈自己,结果治愈了别人,而别人的回应又反过来治愈了他。<br>
写歌的人自己也在水里<br>
写出这些歌的人,网名叫“馄饨皮茄总”。<br>
△图片为AI生成<br>
是在读博士生?博士毕业了?博士后?还是大学青椒?<br>
说实话,我也不知道,他也不敢告诉我。<br>
我只知道他是一名科研工作者,他写下的每一个字,他自己或多或少都亲眼目睹过、亲身经历过。<br>
而这些情绪和作品的集中爆发,发生在一个他不得不从现实中抽离的时间点。<br>
去年七月,他出了一场意外事故,左臂严重骨折,手术之后连正常生活都难以为继,更别提回学校做科研。<br>
但他竟然告诉我,至今他都非常怀念胳膊不能用的那三个月,是他最幸福的时光。<br>
父母把他安置在自家开的月子中心的单间里,有人每天送饭,从睁眼到闭眼,他就坐在桌前创作,不需要操心任何家务。<br>
唯一受伤的是左臂,右手能用来操作电脑,大段空白的时间完全由他自己支配。<br>
在那之前,他一直处于一种快节奏持续高压、不停工作的状态,每天被实验任务、研究任务和各种deadline推着往前走。<br>
△图片为AI生成<br>
那种生活里,一个人很容易忽视自己内心真实的感受是什么,甚至来不及问。<br>
直到骨折之后,他才第一次被允许停下来,尝试用一种旁观者的视角去客观看待自己,去审视那些长期被压抑、被忽视的感受。<br>
科研进度被迫停滞了,但新的东西生长了出来。<br>
去年7月18日那天晚上,观看《歌手》直播,他听着那个熟悉的旋律(原曲出自某冷门女歌手),脑子里突然闪过了另一套歌词的模样。<br>
歌词里写的不是爱情,而是一个博士生面对一次次拒稿时的心酸和疲惫,是审稿人不断否定和打压之后的委屈,是学术梦想一点点碎掉的失落,还有明明已经崩溃、却还是要硬着头皮继续做下去的那种无奈的释怀。<br>
他当天晚上就开始写,第二天中午就写完了。<br>
他未曾预料过这首歌会大火,当时他以为只会有几千次观看,几百个点赞。结果视频一发出去48小时,播放量当即突破了5万。<br>
来自听众的鼓励和正反馈源源不断,于是他开始了平均两到三天一更的节奏,更一条火一条,每天睁开眼都是999+,那种感觉“真的像做梦一样”。<br>
那段时间里他每天早上5、6点起床,晚上9点多就睡觉,或许也正是因为作息健康、精力充沛,去年8月他一口气发了12首作品。<br>
他更没有想到的一点是,这些歌同时在治愈他自己,缝合他的伤痛。<br>
科研完全停摆的那几个月里,他和外面的世界几乎完全切断了联系,出不了门,见不到人。<br>
但每天打开手机,后台都会涌进无数条私信和评论。茄总说:<br>
我不会觉得和这个世界脱节。这个世界在用另一种方式给我反馈。<br>
那些歌词,是他与自我进行的对话,就像是把自己长期压着的情绪拆开来、放大、反复表达的过程。写完之后,他反倒觉得轻松了很多。<br>
他会选择用音乐来表达,很大程度上只是因为一件事:喜欢。<br>
没有音乐科班背景,不识谱,也不会乐器。但音乐几乎贯穿了他所有的日常,恨不得一天24小时把耳机挂在耳朵上——<br>
做实验、跑代码的时候也要放BGM,他觉得只有这样才能撑过那些枯燥的时间。<br>
最初他动手写歌的想法其实很朴素,如果能把这些迷茫、困惑和不甘心做成歌,那以后一个人搞科研的时候,至少可以当作背景音乐播放给自己听。<br>
近五年里,他看了30多场演唱会,从陈奕迅、邓紫棋,到Taylor Swift,再到IU、BLACKPINK,他理解那种被音乐裹住、情绪一下子打开的感觉。<br>
音乐于他,是爱好,也是一种排解苦闷的出口。他说音乐会让人感到生活无时无刻都充满旋律,“它会成为你人生当中的一种伴奏。”<br>
用搞科研的方法论去“搞抽象”<br>
他一开始并没有刻意去总结什么方法。<br>
只是写着写着,处理音乐的方式,就不自觉带上了科研训练留下的痕迹。<br>
只不过研究对象换成了音乐旋律、情绪和人。<br>
第一步,先选歌。<br>
他有一套“选歌三要素”:我听过他的歌,我不讨厌他的歌,我身边的人也都听过他的歌。<br>
在此基础上,还有一个独家的选题库可供参考。<br>
通过逐条读取留言区或私信评论,他主动记录下粉丝的点歌需求,进行歌曲的呼声权重排序,目前已经统计整理了上千条数据。<br>
在他看来,听人劝,才能让别人更喜欢你。<br>
盲目蹭新歌热度不是他想要的,因为那样做出来的作品,往往也与他歌词原本想要表达的主题内核不搭。<br>
这还没完,这段视频所选取的画面,必须得是现场Live,因为音乐现场比录制的MV更沉浸,适合用来释放情绪。<br>
△图片为北京鸟巢五月天演唱会现场<br>
他选素材也有一套标准——<br>
只选两类现场:舞台美学设计在线、歌手当场情绪符合他填的歌词。同时面部特写还不能太多,否则口型不好处理。<br>
所以他会把这首歌市面上能找到的所有Live版本,挨个看一遍,再做决定。<br>
他拒绝用AI生成歌手演唱画面或对口型,哪怕技术上已经可行。<br>
实在碰到没办法对口型的情况,他会选择把那个画面瞬间切换,对准台下的听众,或者来一个远景镜头。<br>
曾经因为找不到满足要求的视频素材,他不得不放弃一首非常想改编的歌,因为画质是他的底线,1080P以下的素材不能用——“这是对观众的不负责”。<br>
当歌曲敲定好之后,第二步进入填词阶段,茄总把它比作写“八股文”或命题作文。<br>
你不是在充满自由的情况下去创作,它有着非常明确的规则、格式和方向在引导你。<br>
他会对着原曲,记录下每一句歌词的字数、断句、重音位置,甚至连原唱在哪里停顿都要打上标记。<br>
最关键的一点在于,改编后的歌词句尾的韵脚发音严格与原词对齐,这是为了确保画面中歌手口型能够自然“对上”,不让观众感到出戏。<br>
原曲的音乐风格,也会对他的填词产生影响。<br>
如果原曲是忧伤的情歌,那二创的歌词就可以用来表达科研人的心酸疲惫、无人认可的悲伤;如果原曲节奏很欢快,他就会在歌词中加入更多自嘲、搞笑、抽象的元素,以乐景衬哀情。<br>
他发现观众特别喜欢看外语歌被改编成中文,但发音依然顺滑贴切的感觉,这背后与一个叫“空耳”的小技巧分不开。<br>
例如,文章开头少女时代的《Gee》,大家耳熟能详的那句“Gee Gee Gee Gee / baby baby baby”,被他改编成了“记记记记 / 背背背”和“寄寄寄寄 / 悲悲悲”;<br>
Michael Jackson的那首《Beat It》的“Just Beat It”,被他改成了“Just 避雷”。<br>
自动播放<br>
△参考文献:迈克尔·杰克逊.《Beat It》EP, 1983.<br>
他还从电影里学了一个技巧:打破第四面墙。<br>
仔细看你会发现,他的歌词里经常会突然冒出来一句直接和观众互动的话,就像是歌手突然抬起头,对着屏幕前的人开口。<br>
填词的工作,大部分时间都是一气呵成写完的,AI基本帮不上什么忙,因为“写词需要人脑主动去思考,需要温度,这是AI给不了的。”<br>
第三步,才到了重头戏,也就是用AI模型生成音乐。<br>
这项工作会占到他总工程量至少一半的时间,甚至有时候能到70%。<br>
在他看来,AI充满幻觉,没有哪一个模型能做到100%稳定不翻车。<br>
突然的升调、降调,咬字发音不清晰,甚至完全改变歌词旋律……诸如此类的情况时有发生。<br>
所以他的应对策略是“赛马”,同时动用Suno、MiniMax Music这样的商业闭源模型,也包括HeartMuLa、ACE-Step这样的开源模型,对同一段内容进行反复“抽卡”。<br>
然后从这些模型生成的歌曲片段里面优中选优。<br>
他会听每一个版本,挑出表现最好的段落,再拼接成完整作品。<br>
抽卡次数多的情况,同一首歌他甚至会反复修改,做出100多个版本。相当于他要把这首歌重听100多遍,可以说是近乎强迫症般的审美坚持……<br>
他对自己的要求只有一条:我不能糊弄粉丝,也不能糊弄我自己。<br>
AI擅长模仿和复制,但不擅长举一反三,它生成的歌很难摆脱原唱的影子,“尤其是当你想添加一些自己想法的时候”。<br>
所以茄总具体改了什么地方?<br>
改配乐,请看弹幕:<br>
改咬字和发音。AI如果念不准某个中文字的发音,就把它改成英文里的同音词,或是笔画更少、发音相近的中文字。<br>
改调(Key)。他会为了YOASOBI《群青》里一个不那么燃的结尾升华,去某鱼花钱找真人歌手录制降调后的Demo,再用AI过一遍,只为了增添那一点点“悲情现实主义”的质感。<br>
自动播放<br>
△参考文献:YOASOBI.《群青》EP, 2020.<br>
如此一番“折腾”下来,你最终听到的是一个好听耐听的版本,这也是茄总放在第一位的衡量标准。<br>
他从不刻意追求对原唱音色的“神还原”。<br>
相反,他希望自己的改编版本,在好听程度和情感表达效果上,能做到让听众暂时忘记这是一首抽象的二创。<br>
“我”的含量很高,作品本身散发出一种主体性,这是他想要的,他也做到了。<br>
△图片为AI生成<br>
但有些问题,到今天他也没有解决。<br>
茄总在改编过程中发现,AI至今都无法处理密集、复杂的和声叠唱。比如在多声道音频面前,模型会失去辨别力,把几个人的声音误认为是同一个人发出的,从而失去了原本的层次感。<br>
这是他目前唯一真正放弃的遗憾。其他的所有较劲,都指向同一件事——<br>
他想把这些歌做得足够好,好到对得起听歌的人。<br>
那群听歌的人<br>
截至去年年末,茄总在后台收到了3000多封粉丝来信。<br>
那是B站推出的年终总结功能,用户可以给自己的“年度挚爱UP主”写一封信。<br>
很多人提到会在做实验时循环播放他的歌,也有人在读博读不下去时反复回来听,甚至有人打算把他写进论文致谢。<br>
这群人需要他的歌,不是因为这些歌能解决任何实质性问题。<br>
事实上,也没有人因为他的歌,真正改变了人生走向。<br>
来这里听歌的人,要么是看完视频庆幸自己当初没选择读博;要么就是觉得——这说的就是我现在的感受。<br>
大家其实是在寻找一种共鸣和归属感。<br>
他们的父母、亲朋好友未必能切身体会他们做科研时的感受和处境,于是需要一个互联网嘴替帮他们发声,从中找到一种精神解脱,然后接着继续苦中作乐。<br>
而且这种状态,并不只是发生在网络世界。<br>
茄总有一个同样在搞科研的朋友,从小唱歌就非常好听,自己也创作过很多歌,但从来没敢发出来,只是私下发给他听。<br>
有一天他们打视频电话,聊到这件事,朋友叹了口气,说已经很久很久没有写过新歌了,因为没有时间。<br>
读博最残忍的一点,是它会把人放进一种长期不确定的封闭环境里。<br>
你不确定自己的实验失败多少次才能成功,不确定费尽千辛万苦写出的paper会不会被拒,不确定还需要多久才能达到毕业要求。<br>
全世界和你做同一个细分方向研究的,可能不超过10个人。<br>
你的父母不理解,你的朋友不理解,尤其是当实验失败、论文被拒、导师也未必能给出有效的帮助的时候。<br>
人在这种处境里,很容易开始怀疑自己,觉得自己一无是处,然后这种自我否定会慢慢积累,甚至变成长期的内耗,慢慢侵蚀进身体里。<br>
更深的困境在于,很多人拼命内卷,最后却发现自己追逐的那个研究方向根本没有意义。<br>
真正有价值的想法早就被人做过了,剩下的大多是跟风的热点、边角料的题材,或者为了满足考核指标硬凑出来的伪命题。<br>
他们不是不努力,但他们自己也搞不清楚,这些努力到底值不值得。包括茄总他自己在内,也是拧巴的曲中人之一。<br>
纯粹靠好奇心驱动的研究,是极少数人才能享受的奢侈品——它需要更高的容错率,也需要更多的资源支持。<br>
绝大多数普通科研工作者只能被绩效和KPI牵着走,什么热点火就做什么,被迫生产出那些可以快速发表、可以拿到经费的东西。<br>
大多数人在踏进“围城”之前,也没有想清楚自己到底该不该、适不适合读博。<br>
很多人要么是出于科研信仰,要么是把学历当投资。但茄总发现,这两种理由都不牢靠。<br>
因为科研信仰会在一篇篇灌水的paper面前慢慢磨损;投资的回报又从来不是稳定的,“绝大部分资质平庸的博士生,毕业之后还是拿不到985和211的教职,也拿不到大厂顶尖的人才计划offer”。<br>
作为同路人,茄总想通过这些歌,把没有摆在明面上的代价讲清楚。很多人只看到读博的好处,但从来没想清楚这背后隐藏着什么。<br>
如果把个体经验拉回到整体层面,这群听歌的人,其实是一个正在持续扩张的群体。<br>
根据国家统计局数据,全国在学研究生人数(含硕士和博士)从2023年的388.3万,到2024年的409.5万,再到2025年的430万,三年连续攀升。<br>
那些听歌的人终究会离开这条路,但还会有新的人走进来,带着同样的疲惫,同样找不到人说话,同样在评论区戒读……<br>
没有人会读一辈子读博士,但是每年都会有新人读博士。<br>
One more thing<br>
今年年初,茄总重新回归科研生活。视频更新的频率不得不回到一周一更,甚至是一月一更。<br>
有人会私信关心他:是不是手头在赶什么paper?是不是论文马上要提交了?<br>
他们替他想好了理由,因为他们自己也是这样过来的。<br>
但茄总依旧没有断更,当然也不会停更。<br>
让他真正下定决心要把这个系列做下去的那个时刻,发生在去年中秋节。<br>
那天他上传视频的时间比平时晚了很多,快到深夜11点才发出去。<br>
他以为没什么人会看,结果不到一个小时,评论区涌进来很多人,给他点赞,留言祝他中秋快乐。<br>
就是那一刻,他突然意识到,“我要守护这个群体。”<br>
曾经,他在工位独自肝到深夜。现在,因为这些歌,他和无数素未谋面的陌生人之间,建立了某种真实的连接。<br>
他想了很久,该对这群人说些什么。<br>
还在考虑要不要读博的人:先想清楚你愿意为它付出什么代价,而不只是你想从中得到什么好处。<br>
正在读博的朋友:不要因为实验失败、文章被拒而否定自己,你的身心健康比任何一篇paper都更重要,都更值得被珍惜。<br>
已经博士毕业的朋友:你能走到今天真的很不容易,接下来的人生,请不必再用同一套标准去证明自己。<br>
他一直觉得自己歌词里写的那个人,是一个有血有肉的普通人。<br>
不是只会坐在原地叹气,更不是什么loser,而是那种在学术生涯里遭受了很多挫折、却还是在积极乐观往前走的人。<br>
你应该认识这样的人。<br>
或者,你就是。<br>
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。<br>
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 科研 歌词 音乐 茄总 原曲 时间 发音 视频 模型 博士 歌手 毕业 旋律 现场 评论 父母 首歌 歌曲 情绪 方向 情况 主题 画面 朋友 博士生 对口型 左臂 作品 记录 次数 质感 程度 赛马 密集 学术 技巧 演唱会 填词 数据 私信 时候 别读博 小时 原唱 原本 博士后 全国 素材 世界 刻意追求 骨折 经验 整体 音乐节 咬字 别提 普通 鸟巢 信仰 北京 意义 国家统计局 女歌手 同音词 冷门 结果 顶尖 月子 视角 用户 问题 题材 眼泪 馄饨 高压 生长 方法 选题 盲目 镜头 画质 命题作文 标记 元素 耳熟能详 结尾 挚爱 苦中作乐 费尽 论文 极少数人 茄总想 终究会 陌生人 计划 单间 旁观者 年终总结 歌能 边角料 |
Verification