NOMN

Speculative Audio Tools
← 工具

RESERVOIR:回声状态作曲器

¥9,999 / ~$63.45
常见问题
RESERVOIR 在哪些平台上运行?
macOS(Apple Silicon,并支持 Intel),格式为 VST3、AU 与 Standalone。Windows 即将推出。如果您在任何 DAW 宿主中遇到奇怪情况,请反馈 bug。
我安装了插件,但 VST 没有 MIDI 输出。
99% 的概率是您只需把许可证/免费试用码复制到 app 中即可。
RESERVOIR 是一个"AI 音乐"工具吗?
不是——至少不是人们通常意义上所说的那种。今天人们提到"AI 音乐"时,通常指的是 Suno 或 Udio 之类的工具:接收一段文字提示("带有忧伤小提琴与印度斯坦人声的 lo-fi 嘻哈"),然后交还一段成品音频文件,连人声都已就位。既然这块容易混淆,我们先来定义这些系统在做什么、不在做什么:它们并非像更早的拼接式合成那样把抓取来的样本拼贴起来;它们是生成式神经模型,最大可能是隐扩散(latent diffusion)架构。其窍门反直觉:训练时,模型通过观看真实(已发布、且大概率无法授权)的音频逐步被噪声淹没来学习,它会变得非常擅长预测每一步加进去的是怎样的噪声。生成时它把这一过程反向运行——从纯静态噪声出发,反复减去它预测"不属于"的部分,把噪声雕掉,直到一段连贯的曲目浮现。没有任何东西是从片段拼装而来的,没有可以指认的接缝。训练语料(同样大多被抓取且大体上未经授权,不过随着唱片公司开始拥抱 AI 音乐、为目录授权并开发自己的引擎,这一情况正在改变)只作为分散于数十亿权重之上的一种弥散统计印记继续存在。

由此输出的是"伪多样性"——表面上的多样性源自一个狭窄的统计盆地,可以生成一千首曲子,却都像从同一块料子里雕出来。

而且还有一个更深的问题——书籍 *Figures in Air*(2015,Inventory Press)十年来一直在推进的论点:音频与音乐不是同一个对象。扩散模型输出的是音频——一张床的照片。音乐则是你真的可以躺下去睡的那张床:一种时间性的、具身的、文化性安置的模式语言,是听者与演奏者共同栖居的。照片可以美得令人窒息,但你仍然不能在上面睡觉。这一点在 AI 还没开始生成"录制的音乐历史"的音频表象之前就已经成立。

RESERVOIR 走的是相反方向。它根本不生成音频,而是生成 MIDI:关于音符在何时发生、何种音高、多大力度、以何种发音方式的符号化指令。它得出这些决定的方式,是对你可见可调的若干历史算法的交叉授粉:Schillinger 的节奏干涉模式、欧几里得分布、马尔可夫链、元胞自动机,以及一个回响状态网络(Echo State Network),其对近期输出的记忆被反馈进下一刻的输出。

由于输出是符号化且透明的,RESERVOIR 可以同时充当多种东西——一个学习工具,用来研究模式逻辑如何产生音乐行为;一本作曲速写本,用于记谱乐谱与演奏分谱;或者,路由到合适的乐器上,成为它自己(可能同样伪多样)的音色纹理生成器(如果这是你想要的)。你可以看到规则、修改规则,并把这些模式从工具里搬出来——搬进一份乐谱、一个合奏、一个房间。

AI 音乐工具倾向于把一个答案塞给你。RESERVOIR 给你的是一个用来作曲的"reservoir(水库)"。我们对当下与未来技术将如何改变音乐创作并不持原教旨态度,但在此特定时刻,把这一替代性的"音乐/计算"资源集合放进世界,作为一条替代路径,似乎是重要的。
它支持 MPE 吗?
支持。RESERVOIR 支持 MPE,并实时生成。手册中有关于 pitch bend 范围、按音符表情、控制器兼容性的细节。
有免费试用吗?
有。在 NOMN.JP 注册账号后,您可以获取一个试用码。点击应用内的 "Unlicensed" 提示即可启动试用或激活许可证。
这些示例曲目是什么?是怎么做出来的?
所有示例都是一个或多个 RESERVOIR 实例进入原味 VSTi 的未剪辑输出。它们并不是完成的作品,也不是经过精修的混音——它们意在展示这款软件可能的范围。它们有意不是令人惊艳的作品,而是不同用例下接近原始输出的示例。
上手有什么建议?
RESERVOIR 是一个庞大的平台,与它能做什么建立关系需要时间——但起步并不难。最有用的一个指引:窗口底部的 CODEX 按钮会用与你当前选择对应的上下文相关说明替换掉可视化。在学习界面期间,请大方地使用它。

界面本身是按"卡片"流来组织的:

- 先用多个生成器中的一种产生节奏事件,再让它们经过 "perforation" 过滤——后者会进一步去规则化,并通过"沉默"来加上额外的标点逻辑。
- 用 pitch 卡片为这些事件分配音高逻辑。
- 用最后一张卡片调整 phrasing、microtiming 与表情。
这些变量在 DAW 里都能自动化吗?
都能——而且您应该用!您也可以在录制 MIDI 时实时驱动这些参数。
为什么没有预设?
我们准备了一套健壮的用户预设系统,让您给自己在 reservoir 中切出自己的一块区域。出厂预设库我们刻意留空——预设容易僵化成默认值,而 RESERVOIR 的设计意图是"被探索",而不是被一页页翻过去。
我具体该怎么把 RESERVOIR 设到 DAW 里?
RESERVOIR 不产生任何声音——它只生成 MIDI。我们的建议是把 RESERVOIR 放在它自己的轨上,使用 MIDI send 把它的输出路由到您想用的 VSTi。这样两轨的自动化通道都完全留给您的创造性介入。
我能用它做 beat 吗?
能。其中两个节奏引擎尤其适用——Beat Grid(基于马尔可夫链的鼓点网格)与 Style Grid(基于鼓语料、按风格作种子的模式漫游)——相对于其他模式更抽象的构造,它们更偏向常规节奏型。它们输出的 MIDI 处于大多数 VSTi 鼓机的音域范围内,不过某些用例下您可能需要把鼓机重映射以接住正确的音符。
再问一次——Reservoir 是不是像 "AI MUSIC"?它是不是用 AI 帮我做音乐,跟 SUNO 或 UDIO 一样?
完整答案见上面的 *"RESERVOIR 是一个'AI 音乐'工具吗?"*。短版本:不是。RESERVOIR 没有样本,也没有用来替您做曲目的音乐训练语料。它利用多种方法,其中大部分在 AI 音乐生成器出现的几十年前就已被实践——许多是用纸笔做出来的。Echo State Network 是一种神经网络,但它的工作是在幕后推动参数,让您用 RESERVOIR 搭出来的模式逻辑在音乐上以有趣的方式漂移。其目的是解决电脑制作中的一个主要问题:太刚性、太确定性,并容易把您拉进循环里——因为反其道而行非常耗时。人类的音乐创作充满了小小的不一致与变化,它们以一种很"非电脑感"的方式恰到好处。
用 RESERVOIR 算不算某种"作弊"?
不算——我们把它构想为一个迅速探索模式与模式演化类型的工具。我们的倾向偏向更实验性的使用,但我们也努力让它能探索相当常规的制作与作曲区域。我们的目标是让它成为一种资源,一池"reservoir(水库)"般的可能素材,可以被发展、裁剪、拼贴、编辑,远胜过被原样使用。

音乐是一种模式语言。

新的模式,新的感受。新的规则,新的模式。新的模式,新的文化。新的文化,新的音乐。

特定文化或亚文化的音乐体系是基于规则的模式语言。这无所谓好坏——它是人类可能性的表达性收获。

用方格纸和数学将这些收获视为算法,过去和现在都不是远离音乐制作的机制,而是深入。它更接近于理解大多数人类一直在"重新排列他人的音符",正如Maryanne Amacher在Intelligent Life中所写。Anthony Braxton所称"风格主义"的实践者,与"重构主义"形成对比。

RESERVOIR是一个探索音乐模式的平台——一种思考音符及其数学关系如何产生和消除文化的方式。

**

算法作曲有着深厚的历史,是关于音乐制作和"作曲"可能是什么的高度创新和富有启发性思考的连续体的一部分。在1960年代极简主义和流行音乐占据主导之前,有一种计算乐观主义认为,用更抽象的理解拆解文化遗产和未被质疑的规范,将允许重塑可能性。

序列主义及其众多分支只是这场对话的一个早期部分——甚至不是起源。紧邻其旁的是Joseph Schillinger,一位俄罗斯理论家,他的学生Lawrence Berk创立了Schillinger House——后来成为Berklee——他的学生和继承者在美学上多种多样,从Gershwin和Gil Evans到Earle Brown。Schillinger的基本思想是周期性的干涉:复杂的音乐时间从重叠时间循环的交互中涌现的原则,而非从任何单一模式中孤立产生。他将节奏视为所有音乐的首要组织原则,先于和声与旋律。

Schillinger并不执着于无调性;他致力于以一种20世纪初的神秘方式连接数学、自然和艺术。其他人以各自的方法跟随——Xenakis在其中——当计算机在学术环境中可用时,"计算机音乐"成为一个独立的研究领域,实现了抽象数学、神经网络,以及现在基于训练数据简单"求解音乐"的transformer和扩散模型。

RESERVOIR是探索音乐制作模式逻辑的资源,而非求解器——一个蓄水池,不是答案。蓄水池积累。它容纳来源多样、交互持续进行的素材。流出的内容受到一切输入和容纳过程本身动态的塑造。

RESERVOIR将这一传承带入实时DAW集成的模式引擎——不是为你作曲,而是作为一个广阔的可调景观。一个复调纹理编排器,通过数学扎实的算法管线生成、穿孔和塑造12个同时进行的MIDI声部,每个都根植于特定传统——并由机器学习层增强:一个Echo State Network,其循环神经元保持系统自身输出的衰减回声,通过Schillinger九十年前形式化的同类时间干涉产生新模式。它倾听自己并持续演化。它不是步进音序器,虽然你可以制作序列。不是随机音符生成器,虽然你可以生成准随机的微时序云。它是一个系统,其内部逻辑汲取了一个世纪以来关于如何同时以严谨和惊喜组织时间与音高的思考。未来更新将添加更多逻辑,但就目前而言,有超过100,000个独特场景可供发现素材、创建纹理或构建整首作品的新框架。

输出是标准MIDI,时序非常精确,支持微分音。将其路由到任何乐器。录制它,编辑它,在其基础上构建。

RESERVOIR产生的不是原始素材。它是有模式的素材——来自先于并超越任何个人著作权主张的传统和数学逻辑的模式。作曲一直是与继承结构的协商。RESERVOIR使这种协商变得显式、可导航且富有成效。

--
## 工作原理

每个音符经过四个阶段:

生成。 17种节奏技术决定音符何时出现。完整的Schillinger节奏词汇第一册——合成节奏、分组公式、多生成器干涉、器乐时间节奏、时值组协调、时值与休止的排列、同质连续性、分配幂、增长序列和加速曲线——以及随机云、欧几里得分布、L-系统分形、谐波级数脉冲流、Markov链节拍网格,和从开源鼓模式语料库中提取的风格种子模式漫游。

穿孔。 7种方法决定哪些音符被移除——沉默落在哪里,以什么逻辑。素数筛、基于Fibonacci的过滤、黄金比例准周期格子、元胞自动机、模运算滤波和从开源鼓模式语料库学习的密度曲线。

音高。 12种算法决定演奏什么音符,取自序列耗尽、频谱干涉、Markov链、组合排列、对称反转、语料库学习的转换和琶音器模式。和声指挥系统支持用户自定义和弦词汇与自动声部进行。跨越112+音阶,涵盖西方调式、日本筝调律、印度拉格、Yusef Lateef的合成音阶以及微分音系统。

表情。 力度塑形、5种演奏法风格、6组连续CC控制器(力度、音色、颤音、演奏法、效果、踏板)带乐句响应包络,以及4种微时序模式:节拍器式、NOMN表现性时序、从现场MIDI演奏捕获的用户律动轮廓,和从鼓语料库提取的风格特定微时序。不是随机jitter。是响应密度、乐句位置和风格传统的上下文律动。

--
## 引擎

12个独立层,每个运行自己的节奏生成器、穿孔滤波器和音高模式。全部流式处理,全部实时运行,全部与DAW走带同步。基于PPQ的时序。

层通过5种交互模式协调:同步呼吸、互补交错(层填补彼此的间隙)、级联卡农式进入、单声部单音优先或完全独立。复合密度模型在所有引擎组合中规范化输出,使切换算法时保持感知密度——纹理变化而非重量。层交互模式将相同的算法设置转化为截然不同的纹理。

Echo State Network作为元生成层位于引擎之上。它从RESERVOIR自身输出中读取音乐特征——密度、规则性、音程大小、音域范围、切分、摇摆、复调性、轮廓——并在音高、节奏和纹理维度上产生调制偏差。蓄水池保持音乐近期过去的时间回声;新的调制从这些衰减痕迹的非线性干涉中涌现——Schillinger描述为周期性交互的同一原理,现在在作曲演化层面运作而非音符级节奏。单个Evolution Rate旋钮控制网络的响应速度。零值时几乎冻结;满值时自由漂移,引入从音乐本身而非随机调制中涌现的动量、半音牵引、音色偏移和节奏张力。

和声指挥模式允许你定义和弦词汇——最多32个——RESERVOIR通过自动声部进行在它们之间移动,由ESN张力交叉驱动并量化到乐句边界。单个Drift旋钮控制和声漫游的自由度。

状态序列器提供宏观层面的形式:2-8个段落,可配置交叉淡入淡出、弧线形状(黄金分割、拱形、楔形)和可选的语料库导出的形式比例。让它运行10分钟,录制一首构建、释放和演化的作品,无需触碰任何参数。

MIR捕获系统分析现场MIDI输入——提取音高轮廓、节奏轮廓、摇摆、乐句边界和演奏风格——并将由此产生的演奏指纹反馈到生成引擎。弹奏一个乐句;RESERVOIR吸收其特征并从中生成。

参数变化或音阶选择前有133,000+个独特算法组合。

--
## 参数

Rhythm Engine
- Density Min/Max:每拍攻击数(0.1-10)。复合模型:滑块值=所有层的总事件/拍。
- Note Length Min/Max:时值作为间隔的比例(0.1-2.0)。
- Rhythm Pattern:Stochastic、Resultant、Grouping、Density Field、Euclidean、Harmonic Series、Multi-Generator、Instrumental、Coordination、Permutation、Continuity、Power Group、Growth Series、Acceleration、L-System、Beat Grid、Style Grid。
- 引擎特定控制:17个节奏引擎各自暴露其参数集。

Perforation Engine
- Perforation Amount:间隙密度(0.0-1.0)。
- Perforation Method:Euclidean、Prime Sieve、Fibonacci、Modular、Golden Lattice、Cellular Automata、Corpus Density。

Pitch Logic
- Pitch Selection:Serial、Spiral、Fibonacci、Registry、Markov、Golden、Interference、Symmetric Inversion、Permutation、Corpus Markov、Arpeggiator、Harmonic Conductor。
- Harmonic Conductor:最多32个和弦、17种和弦品质、Drift旋钮、八度移调。
- Pitch Pattern Shape:算法特定控制(0.0-1.0)。
- Scale:内置库中的112+音阶。
- Root Pitch Class:C到B。
- Octave Span:1-10个八度。

Expression
- Velocity Min/Max:MIDI力度范围。
- Articulation:Full Length、Legato、Staccato、Tenuto、Varying。
- Groove Feel:Metronomic、NOMN expressive timing、User Groove、Genre Groove。
- Phrase Elasticity:密度响应的音符缩短。
- 6个CC组:Dynamics、Timbre、Vibrato、Articulation、Effects、Pedal。

Echo State Network
- Enabled:开/关切换。
- Evolution Rate:控制漂移速度的泄漏率(0.0-1.0)。
- 音高、节奏和纹理组的16个深度滑块,用于逐维度调制控制。
- 实时偏差可视化。

State Machine
- Sections:2-8个作曲段落。
- Section Length:每段15-180秒。
- Section Crossfade:0-100%渐进过渡。
- Arc Form:Random、Golden Section、Arch、Wedge、Corpus。
- Auto-Evolve:自动状态推进。
- Arc Position:手动位置覆盖(可自动化)。

Layer System
- Active Layers:1-12个同时声部。
- Layer Interaction:Independent、Inverse、Complementary、Synchronized、Monophonic。

MIR Capture
- 现场MIDI输入分析:音高、节奏、律动、演奏法、复调性。
- 演奏指纹播种所有生成引擎。
- Morph控制用于混合指纹与算法输出。

Visualization
- 8种色彩模式:Greyscale、Chromatic、Register、Interval、Tension、Schillingerian、Scriabin、Rimsky-Korsakov。
- Style Grid模式轨迹可视化,用于风格种子引擎。
- 乐谱视图和径向格式塔视图。
- 音高类网格和宏观弧线预览。

Presets
- Preset Morph:任意两个预设间的交叉淡入淡出(0.0-1.0,可自动化)。
- MIDI Program Change:外部预设切换。
- 128槽预设库用于DAW集成。

--
## 功能与格式

主要功能:
- 12层复调生成:逐层独立的节奏、穿孔和音高,5种协调模式和复合密度规范化。
- Echo State Network:循环网络读取自引用音乐特征并输出连续调制偏差。从自身输出演化作曲的机器学习层。
- 17个Schillinger完整节奏引擎:Schillinger第一册节奏词汇(第2-14章)的完整实现,加上随机、欧几里得、L-系统、Markov网格和风格种子语料库模式。
- 12种音高算法:包括具有用户自定义和弦词汇、自动声部进行和ESN驱动和声转换的和声指挥。
- MIR捕获系统:实时MIDI演奏分析。弹奏一个乐句;RESERVOIR吸收其特征。
- 风格种子模式漫游:开源鼓模式语料库处理为风格特定的原型模式。Style Grid引擎以可控漫游率行走这些模式。
- 风格律动微时序:从鼓语料库提取的逐风格时序偏差,用于风格真实的人性化处理。
- GPU加速可视化:所有层的实时径向显示,8种色彩分析模式根植于Scriabin、Schillinger和Rimsky-Korsakov色彩理论。
- 112+音阶库:西方调式、日本筝调律、印度拉格、Yusef Lateef的音阶与旋律模式库、合成音阶和自定义音高集。
- 状态序列器:宏观作曲弧线,带交叉淡入淡出段落和5种弧线形式。
- 预设变形:任意两个预设间可自动化的交叉淡入淡出,实现平滑的音色过渡。
- 音频门控:将穿孔模式应用于现场音频输入,对外部信号进行节奏雕刻。
- 内置GM合成器:基于Apple DLS的General MIDI合成器用于独立试听——零外部依赖。
- MIDI导出:多轨输出保留逐层复调结构。
- DAW走带同步:基于PPQ的时序实现完美速度同步、走带跳转和循环处理。

兼容性:
格式:VST3、Audio Unit (AU)、Standalone。
操作系统:macOS(Apple Silicon + Intel)。