【Review】guk.ai「Sistema2」レビュー(世界初のAIソフトウェアシンセサイザー・使い方・評価)

前々から気になっていたので今年になってようやく購入してみました。

メーカーによる一次情報

guk.ai の Sistema2 は、人工知能の魔法とサウンド合成の領域を融合させた初の AI 搭載ソフトウェアシンセサイザーです。音楽とスタイルを学習、適応し、前例のないレベルに高める楽器で、次世代の音楽創造性を体験してください。

Sistema2のプロンプト機能

Sistema2 の Prompt サウンド生成機能を使用すると、テキストの説明を入力するだけで、ユニークで複雑なシンセサウンドを瞬時に作成できます。「エアリーなパッド」から「共鳴するベースライン」まで、AI 搭載エンジンがユーザーのリクエストを解釈し、完璧なサウンドをリアルタイムで作成して、クリエイティブプロセスを効率化します。

AI駆動型エフェクトチェーン

Sistema2 の AI 駆動型エフェクトマクロを使用して、サウンドデザインの可能性を最大限に引き出します。インテリジェントなシステムは、作成するサウンドに基づいて最適なエフェクト、モジュレーション、信号ルーティングを提案して適用し、推測を最小限に抑えながら音響の可能性の世界を広げます。

サウンドカテゴリーとキャラクターによるAIによるサウンド生成

プリセットライブラリを延々と閲覧する必要はもうありません。Sistema2 の AI によるサウンド生成と適応学習により、シンセサイザーは必要なサウンドを直感的に生成し、音楽やスタイルに最適なサウンドを簡単に見つけることができます。

エキスパートモード

Sistema2 のエキスパートモードは、サウンドのあらゆる側面を最大限にコントロールしたい熟練したプロデューサーやサウンドデザイナー向けに設計されています。このモードでは、高度なサウンドコントロールが可能になります (Sistema2 の新しいバージョンごとに、より多くのコントロールが追加されます)。

特徴

AI 駆動型サウンドデザイン:思い描いたサウンドを表現するだけで、ユニークなトーンとテクスチャが生成されます。「温かみのあるパッド」や「ざらざらしたベース」などと言うと、Sistema2 が無限のバリエーションを作成します。
AI 搭載のエフェクトチェーン:入力信号にリアルタイムで適応し、ダイナミックで進化するテクスチャを作成するエフェクトチェーン。
適応型およびリアルタイム学習:演奏すればするほど、Sistema2 はあなたのスタイルをより深く理解します。あなたの好みに合わせたサウンドの提案、エフェクトの調整、モジュレーションの強化を提供します。
無限のサウンドスケープ:無限のサウンド生成アルゴリズムにより、探索できる斬新な音響風景が尽きることはありません。
直感的なインターフェース:わかりやすいユーザーインターフェースにより、初心者でもプロでもサウンドデザインが簡単になります。
クラウドベースのプリセット:世界中のトップアーティスト、プロデューサー、サウンドデザイナーがキュレーションしたコミュニティ主導のサウンドライブラリにアクセスし、貢献できます。
多言語: Sistema2 プロンプトはすべての言語をサポートします。
AI 駆動の EQ とダイナミクス:シンセサイザーは、作成しているサウンドに最適な EQ とダイナミクス設定を提案します。
スペクトルモーフィング:さまざまなスペクトル間の AI 駆動モーフィングにより、ユニークで進化するサウンドを作成します。
動的音声割り当て:可能な限り最高の音質を維持しながら CPU 使用率を最適化する AI を活用した音声割り当て。

詳しい内容は製品ページも併せて確認してみてください。

Sistema2

機能と使い方

guk.ai「Sistema2」は世界初のAIソフトウェアシンセサイザー。AIと一口に言っても具体的には何をしてくれるシンセサイザーかというと任意の音色の説明(言語は英語です。多言語とありますが、筆者が操作した限りでは日本語入力は文字化けしてできません。長文を必要とせず数ワードでも機能するのですが、ある程度ボキャブラリーの量やスペル入力に慣れていた方が実用面で良いのは間違いありありません)を入力してその指示内容に即した音色を自動的に内部のパラメータ設定を行って用意してくれるシンセサイザーです。例えば、"Warmy Plucked Analog Synth"と入力したとしましょう。そうするとその雰囲気の音色を勝手に生成してプリセットのように用意してくれるのです。

下の画像ではJuicy Bassとざっくりとした説明を入力したところ張りのあるアナログライクなベースサウンドが出てきました。

ちなみに既存のプリセットから検索するのではなく、（内部処理はブラックボックスですが少なくとも音色のプリセットにアクセスすることはできません。）ユーザー目線ではゼロから生成されます。それぞれの音色には4つのパラメータのノブが用意されて操作することによって音色をさらにコントロールできます。生成された音色によってパラメータは異なるようです。このあたりはUJAMのUsynthを思い浮かぶ人も多いでしょう。下の例ではブースト（低域を持ち上げるような処理でしょうか）、Dynamite（ダイナミックコントロールで音圧を高めるタイプ）、D-Expand(アナログディレイ風のステレオ幅拡張)Darkness（ヴィンテージスタイルのリバーブ）といったようにパラメータによって処理が異なり、また、単純な処理ではなくそれぞれが複合的なエフェクトのように個性がある処理を行うのでかなり面白いところです。パラメータを覚えるというよりはとりあえずいじってみるといったように設計されていると思います。ピッチドリフトのノブのほかに左端のＡＭのスイッチ切り替えでモノシンセにすることもできます。ちなみに、真ん中の丸いボタンを押すことで音色を再生成することが可能。後、同一のテキスト支持でも複数回試行すると毎回異なる音色が生成されます。

少し関心した点としては生楽器に関する用語を入れるなど生成の対象外のプロンプトを入力すると拒否されます。適当に音色を出さないあたりに好感度が高まります。

生成した音色のプリセットは保存することができます。保存すると生成した曜日とともにリストで表示されて通常のシンセと同様に音色を呼び出すことができます。

また、プロンプトモードの他にシンプルに音色を用意するモードも用意されていて合成アルゴリズムを選択することができます。808、ベース、シンセ、パッドなど音色のカテゴリーを選び、それぞれの音色の性格を選択するとそれに応じた音色が生成されます。画面では暖かみのあるプラックサウンドを生成している途中です。再生成させると同じ指示内容で別のバリエーションが出てきます。

ポリシンセ。

推測になりますが、プロンプトのアルゴリズムもこのカテゴリーの下で区分してアルゴリズムの選択をし、生成しているのではと思ったりします。これに関しては専門外ですのでよくわかりませんが。

最後にそれぞれの音色には共通してアドバンス機能（？）として通常のシンセでおなじみのサウンドエディット機能が用意されているのでFMやLFO、ADSRなど一般的なパラメータコントロールで音色を整えることが可能です。標準的ですが、AI生成といった異なるアプローチの中でこれがあるとないとでは大違いです。

Sistema2

AIの精度について・総合評価

ここまでの内容から思った通りの音色を支持して即座に音色が作れるという理想的な機能が付いたシンセサイザーということはわかると思いますが、重要なのは音色とAIの精度

おそらく多くの方が気になるところだと思います。筆者のファーストインプレッションとして感じたのは思ったより良い音が出てくるといった印象でした。この手のAI生成系は画像生成もそうですが、細かい部分にボロが出るといいますか、あくまで偽物にとどまることも多いですが、このシンセサイザーも確かにたまにオーディオとして破綻はしていないもののいけてない（？）音色が出てくることがあります。しかし、1回目の試行で他のシンセの音色に匹敵するような及第点の音色が出てくる確率が高いと感じます。ここで他のシンセの音色を比較して引き合いに出したのには理由があります。このシンセのAI生成の特性なのかもしれませんが、斬新な音色(ちょっとひねった個性的な音色が出ることもありますが、Tracktionなど最先端のアプローチで設計したシンセから出てくるような新鮮な音色)が出てくるというよりは当たり障りのない汎用性の高い音色が出てくることが多いと感じ、無難な設計になっているのが一つの特徴ともいえるからです。これは必ずしもマイナスとはいえず、むしろ安定性を重視して設計したのではとも考えられます。アナログサウンドを指示して生成するとしっかり深みのあるサウンドが出てきます。実際のアナログサウンドと一致するかどうかはあまりここでは重要ではなく、雰囲気がしっかり感じられる音色が数回の試行の中で出てくるかと思います。後、メーカー説明によるとリアルタイム機械学習とのことでこれまでの入力内容等に応じて、好みの音色を提案するようになっているようです。これは筆者としては判断しようがありませんが。文字通りですと良いことです。筆者は音楽領域のAI生成自体がまだまだ発展途上と思っている側の立場をとっていますが、実用性といった意味ではかなり健闘していると評価したいところです。細かい修飾語句も反映してくれるようでMetalicと加えるとFMやリングモジュレーションを感じさせるような金属質な音色が出てきます。鉄琴のような音色が出てくることもあります。前述のようにアコースティック楽器はアルゴリズムの範囲外ですが、しっかり質感が出ていて結構リアル。デジタルシンセのリアルな音色に近いと思います。プラックもしっかり張りのあるプラックが出てくることが多い印象です。アナログシンセ風のサウンドも生成されるものの中にはしっかり本物風のざらつきがついています。忠実に再現するシンセではありませんが、音色の音質は全体的によくできているので少し驚きました。

このあたりはプロンプトのAI指示職人の腕の見せ所だと思います。シンセのテクニカルタームではありませんが、シンセサイザーのプリセットの名前で使われる形容詞などを織り交ぜると良い感じで指示が反映されることが多い印象です。後、それぞれの音色のカスタマイズされたエフェクトが結構優秀で、申し訳程度の平凡なエフェクトではなく、しっかり、音色を思い通りにコントロールできるような便利なエフェクトが使えるので意外でした。AIによりエフェクトチェインを提案するようです。UIをみてわかるように複雑なモジュレーションなど現代的なサウンドデザインをするシンセではありませんので、外部エフェクトに頼りましょう。生成される音色もデジタルシンセ、アナログシンセといった往年のシンセサイザーの音色が多い印象です。このシンセサイザーのウィークポイントとしては処理がやや重い点。プロンプトで生成すると単発で鳴らしていても一般的な音楽制作に適したそこそこのハイスペックPCでも複数トラックを立ち上げている状態だとDAWの負荷で50-70%あたりを推移します。(環境によって差はあると思いますが、筆者が試した限り、他のSerum、Avenger 2などと比較しても重いと感じます。)音色によってはさらに上を行きます。スペックに不安のある場合はそこをまず確認した方が良いと思います。気軽に音色が出てくるというところが非常に便利で魅力なので軽さも欲しいところですが、内部で色々な処理をしているからでしょうか。全体的に音質の水準が高めなのももしかしたら関係しているかもしれません。後、音色は一期一会なのでプリセットを保存しない限りは再生成すると巻き戻せません。RedoとUndoが欲しいところです。これはシンセを使い慣れている人にとっては重要なポイントだと思います。

総じてプロンプトで柔軟に音色を指示してカスタマイズした音色を設計できるという高いハードルの機能を実用性の範囲内の精度で設計できているように感じ、さらなるアップデートでもっと期待してもよさそうな可能性を感じるシンセサイザーです。

Sistema2

セール情報

セール頻度は今年になって少し頻度が多くなりました。49ドルあたりをセール時に推移することが多い印象です。

Sistema2

FreeKontaktina

このブログを検索