AI技術とクリエイティビティ
2019.11.29

AI時代のクリエイティビティ-「人間らしさ」からのズレを愛する(編集部コラム)

紅白歌合戦にも出演するということで、「AI美空ひばり」が話題です。AI(人工知能)が、美空ひばりさんのレコーディング素材や家庭での話し声が録音されたテープから、アクセントやニュアンスを深層学習(ディープラーニング)。本人が歌ったことのない曲でも「本人らしさ」を保ったまま歌わせることができるヤマハ社の音声合成技術「VOCALOID:AI」が用いられています。

ちなみにAIを使った音声合成技術は他社でも開発が進んでおり、主なところではマイクロソフト社が開発している「AIりんな」と、名古屋工業大学とテクノスピーチ社が開発している「CeVIO」があります。

AIりんな / りんなだよ (Music Video)」
「CeVIO AI歌声合成システムによる「ダイヤモンド」Demo」

Soundmain Blogでは、AIを用いた最先端の「音源分離技術」についてインタビューを行ったこともありましたね。

さてその名の通り、初音ミクでおなじみの「VOCALOID」の流れを汲む「VOCALOID:AI」。具体的にどのような技術が使われているのでしょうか。

「ITmedia」の記事によれば、今回使われているAI技術は、機械学習の一種であるディープニューラルネットワーク(DNN)というものだそうです。

ニューラルネットワークとは、人間の脳を模倣したアルゴリズムの一式です。人間の脳は複雑な神経回路が張り巡らせており、筋肉に命令を出したり、発声をしたりなどの様々な行為に応じて、信号の走る回路が変わります。その時々の回路のことを「モデル」と言います。

今回のプロジェクトにおいては、

  • 与えられた楽譜を読み込んで、音程を決めるモデル
  • 発音のタイミングを決めるモデル
  • 上記を組み合わせてコントロールするモデル
  • 最終的な波形を合成するモデル

など、複数のモデルを段階的に用いて音声を合成しているとのことです。

これにより、楽譜には隠れてしまう複雑なニュアンスも高いレベルで分析することが可能に。隣り合う音との関係や、曲全体の盛り上がり具合を考えながら表現を変えるなど、より「人間らしい」歌声に近づけることができます。

「AI美空ひばり」を取り上げたNHKの番組では、本人の姿を模したCGモデルが用意され、また「川の流れのように」を作詞した秋元康氏が新曲の作詞を手がけるなど、「本物」の美空ひばりさんがそこにいて、新曲を披露しているかのような体験を作り出すための演出がなされていました。AIを用いた表現の可能性は、そのようにして「本物(人間)を再現する」ことに限られたものでしょうか。

筆者が特に気になった2つの事例を紹介します。

アイドルグループ・仮面女子の楽曲「電☆アドベンチャー」は、電気通信大学の坂本真樹教授とのコラボ作品。坂本氏は普段、オノマトペを数値化する研究や、色やイメージから言葉を作る人工知能の研究などを手がけています。

「World’s first! The song which AI!世界初!絵からAIが作詞。電☆アドベンチャー 電気通信大学×仮面女子」

その技術を応用し、仮面女子の楽曲「超☆アドベンチャー」からメンバーがイメージして描いたイラストの色彩を数値化、その類似度が高い単語とオノマトペを掛け合わせることで歌詞が生まれたとのこと。メロディー、トラックは原曲と同じものを使っているため、文字数が同じになるように、生成した言葉を自動的に当てはめこむこともAIが担当しています。

また4人組ユニット・Maison book girlの楽曲「言選り」では、プロデューサーを務めるサクライケンタ氏が過去6年間で手がけたすべての歌詞をAIが深層学習。その結果として出力されたテキストの中から、サクライ氏自身が「自分には思いつかないだろうな」と思ったフレーズを選別するという、「AIとの共同作業」によって歌詞が生まれました。

「Maison book girl / 言選り / MV」

サクライ氏曰く、「普段日本語を話す人には思い付かないような言葉の組み合わせが多く出てくるんです。それが逆に面白い」「(やりたかったのは)AIが書いた膨大な文字数の文章と向き合って、自分自身と対話すること」とのこと。

2つの事例に共通しているのは、はじめに既存の楽曲なり、イラストなりがあって、それをAIが「解釈」、出力されたものをさらに人間が編集したり、パフォーマンスするという「人間とAIの対話」の中から生まれた作品だということです。そして、それはサクライケンタ氏が言うように、実は「自分自身との対話」から生まれた作品でもあるのです。

AIの最大の長所は、膨大なデータを高速で処理できることにあります。入力するデータが膨大であればあるほど、複雑で予測のつかない――AIなりの“創造性”に富んだ――出力結果を返してくれることも増えるでしょう。

電通大の坂本氏は先ほど引用したインタビューの中で、「人間の創造力をサポートし、生活が楽しくなる『愛されるAI』を目指している」と語っています。

紅白歌合戦の「AI美空ひばり」パフォーマンスで、初めてAIによる音声合成技術を知る人も多いはず。「本物(人間)を再現する」ことができているかに注目するだけでなく、あらかじめ「人間らしさ」とはズレたところにいる存在として「愛してあげる」ことで、いままでになかったタイプの作品を作り出すヒントが得られるかもしれませんよ。

文:Soundmain編集部

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA