各クリエイティブ界隈にて脅威的な進化を続ける生成AIツール。本記事では、生成AIを使ってアニメ制作を行う『AIアニメプロジェクト』の中心となる田中義弘さん、川上 博さん、進藤弘輝さんを講師に迎え、クリエイターやAIデザイナーなど、立場の異なる三者が生成AIをどのように使っているのか、Stable Diffusionでの生成手順、各生成AIツールのアウトプット比較など、AIを使った実演を交えながら解説する。


講師   田中義弘 株式会社taziku 代表取締役

2018年 中京テレビ放送との合弁会社、XRエンターテイメントを創設。XR・VTuber領域に注力。2021年 DMM.comに株式売却しEXIT。その後、株式会社タジクを創業し、現在は「AIアニメプロジェクト」や生成AI導入支援・コンサルティング「DXAI」など、AI領域に注力。

講師   川上 博 株式会社K&Kデザイン 取締役

K&Kデザインは、名古屋を拠点に活動するデザイン会社。 各種キャラクターデザインや工業デザインなど手掛けながら名古屋で完結できる本格的なアニメ制作を目指し 2015年からTVシリーズアニメの企画・映像制作・デザインを開始。さまざまな企業のTV・WEB等のアニメCM映像制作も行う。

講師   進藤弘輝 SOPHIE.STUDIO 代表

デザインディレクター、アートディレクター、UX/UIデザイナー、名古屋市デザインアドバイザー。現在は、SOPHIE.STUDIOにて企業ブランディングから戦略、WEBサイト開発、アプリ開発、映像制作、自動車の開発に至るクリエイティブ全般で、名古屋、東京、海外にて幅広く活動。




立場の異なる3社が目指していること

AIで制作されたものに魂を宿すためのアライアンス


生成AI時代を象徴するようなキャラクターを創造することが最終的な目標

『AIアニメプロジェクト』を立ち上げた元々の経緯は、K&K DESIGNとtazikuのアニメ制作における業務フロー改善が主な目的でした。制作フローを分解し、「ここはAIでやったほうが楽になるんじゃないか」というところから始まり、その後SOPHIE.STUDIO が合流して、「現在のアニメ文化に対してもう少しAIを使ってチャレンジができないだろうか」という部分で本格的に3社が集い、動き出したのが当プロジェクトです。

AIで作成された絵は現状でもとてもクオリティが高いと思うんです。もちろん、やり方や生成AIの種類によっても変わりますが、適切なものを選べば絵が描けない人間でもある程度のクオリティの絵を作ることが可能です。その反面、どうしてもキャラクター性が薄かったり、「魂がこもっていない」と言われることも多いんですね。3社で組むことの狙いとしては、そういった部分を分解し解消していくことで、皆に支持されるようなキャラクターをAIでも作り出すことができるんじゃないか、といった部分にあります。

3社の役割としては、tazikuがテクノロジー、K&Kがアニメーション、SOPHIE.STUDIO がブランディングといった、それぞれが得意分野を担当することでAIの絵に魂を込め物語を付与することを目指しています。最終的には、ボーカロイドの初音ミクやVTuberのキズナアイのように、テクノロジーの大きなターニングポイントである生成AI時代を象徴するようなキャラクターを創造することを目標としています。

今回の記事では、生成AIツールの実演を交えながらAIツールの使い方や、同一プロンプトによるアウトプットの比較など実践的なAI活用術について解説していきます。


●『AIアニメプロジェクト』とは…

 AIとクリエイターで日本のアニメ文化の資産を新しいステージへと導くことを目的としてスタート。

 AIを利用したアニメ『アイアニ(AIと愛情を込めてアニメ制作中!)』を発表。

 homepage ● https://bit.ly/aianime_00




AIツールの分類と種類

AIは大きく5つのタイプに分類される

 識別系AIや予測系AI、会話系AIをよく見聞きするが、ChatGPTの登場以降は生成系AIに大きく注目が集まっている。

 機能: 識別する

 詳細: 文字認識、画像認識、動画認識

具体例: 文章の誤字・脱字などを識別し、校正する

     道路の路面状況から、ひび割れなどの劣化を判別

     食品の良品と不良品や、野菜のサイズといった出荷規格などを識別する

 機能: 予測する

 詳細: 顧客行動予測、需要予測、 異常検出

具体例: 気象データや過去の売上データなどから、今日の売上を予測する

     過去の交通情報とリアルタイムの交通情報から渋滞予測を行う

 機能: 話す

 詳細: チャット、翻訳、音声認識

具体例: カスタマーサポートなどのチャットボット

     異なる言語圏同士の会話をサポート

     電話問い合わせに対してコミュニケーションする

 機能: 作る

 詳細: 画像生成、音声生成、動画生成

具体例: 対話型のインターフェイスで文章を生成

     テキストからイラスト・写真などの画像生成

     テキストや画像から、動画やアニメーションを生成

 機能: 動く

 詳細: 自動運転、ドローン、ロボット制御

具体例: 清掃ルートを学習し最適な清掃を行う清掃ロボット

     周囲の状況を認識し、事故を回避して運行する自動運転

章や画像だけでなく、動画や音楽、3Dオブジェクトなどあらゆる生成サービスが登場している。

●生成AIのカテゴリー

内容: 対話型で文章を生成、直近マルチモーダル化

代表的なサービス: ChatGPT、BingAI、Bard

内容: テキストから絵や画像、写真などを生成

    画像やその他、リファレンスからも生成

代表的なサービス: Stable Diffusion、Midjourney、DALL-E3

内容: テキストや画像から、動画やアニメーションを生成

    既存の映像を新しい映像に変換することも可能

代表的なサービス: Runway Gen 1&2、Stable Video Diffusion、Pika 1.0

内容: テキストから音声や音楽を生成

    音声の変換、編集、ダビング、翻訳なども可能

代表的なサービス: Stable Audio、RVC

内容: コードのチェックやコーディングサポートが自然言語で可能

    画像からプログラム生成なども可能

代表的なサービス: GitHub Copilot、Cursor

内容: テキスト/画像から3DCGを生成

    動画から3Dシーンを生成可能

代表的なサービス: CSM、Luma AI Genie



さまざまな分野におけるベースメントの技術としてAIがだいぶ使えるようになってきた印象

現在AIは、大きく分けて「識別系AI」「予測系AI」「会話系AI」「生成系AI」「実行系AI」といった5つのタイプに分類ができます。

識別系AIとは、文字や画像を認識・解析し判断するものです。予測系AIは、マーケティングなどで使われる顧客行動の予測や渋滞予測などです。会話系AIは、チャットや翻訳、音声認識など顧客と話すことを目的としたものです。生成系AIは今回僕たちがメインで取り扱っている部分で、画像だけでなく音声や動画、最近では歌などさまざまな形で進化している分野です。実行系AIは、ドローンやロボット、自動運転・操縦などにあたります。

現在は、さまざまな要素を複合したChatGPTなどのマルチモーダルAIと呼ばれる分野が進化しており、例えば部屋の写真を撮影して送ることで、その部屋にあったインテリアコーディネートを設定した口調でキャラクターが提案してくれたり、対話型で文章を生成してくれたりと幅広い用途での活用がされています。

特に近年進化しているのが動画部分で、テキストから動画を作成するサービスや指定した画像をベースにして動かす生成サービスなども存在します。また、既存の映像を新しい映像に変換、声を学習させて音声を復元、コード生成なども可能になりました。さらには、テキストや画像、動画から3DCGを生成することもできます。このようにさまざまな分野において、ベースメントの技術としてAIがだいぶ使えるようになってきた印象を受けています。



生成AIを取り巻く現状

AIと著作権の関係について

大前提として現行法的にはクリアしているというのがチームの認識

法律的な観点から、生成AIで仕事をしていくとどうなるのかという部分について、大前提として“現行法的にはクリアしている”というのがチームとしての認識です。これを論ずるにあたってはいくつかの問題となるテーマがあります。ひとつは、無断学習したモデルを使っていいのかという問題。もうひとつが、AIで作ったものが著作権侵害になるのではないかという問題。そして、感情的な問題です。

まず、学習段階についてですが、文化庁が2023年に出した資料によるとAI開発の学習段階では基本的に学ぶことが目的のため、直接的に利益を侵害する行為ではなく、享受を目的としない利用行為といったところに現段階では収まっています。

また、著作権侵害かどうかの観点はシンプルで、似ているかどうかの“類似性”と、意図してマネたかどうかの“依拠性”の2点です。このふたつが同時に満たされた場合は著作権侵害になります。なので、僕らのスタンスとしては、学習段階については原則法律的にクリアしており、作ったものが似ていなければ著作権侵害にもならないため、しっかりとそこをチェックをするという形で対応しています。

ただし、AIには法律的に正しくともSNSや世論が盛り上がって潰れたケースも多いので、感情的な問題を企業リスクとして捉えたときにどういった処理を行えばいいのかを考えることが最も大事になってくるのかなと思っています。



『AIアニメプロジェクト』が懸念していた問題点

●著作物に表現された思想又は感情の享受を目的としない利用(著作権法第30条の4)より

 ・ 著作物を学習用データとして収集・複製し、学習用データセットを作成

 ・ データセットを学習に利用して、AI(学習済みモデル)を開発

AI開発のための情報解析のように、著作物に表現された思想又は感情の享受を目的としない利用行為は、「原則として著作権者の許諾なく行うことが可能」(権利制限規定)。



①類似性(他人の著作物と同一・類似)があるかどうか

②依拠性(他人の著作物に依拠)があるかどうか

※抽象的な「アイデア」や「画風」は、著作権法では保護されない。

AIが自律的に生成したものは、 「思想又は感情を創作的に表現したもの」ではなく、著作物に該当しないと考えられる。

出典:令和5年度著作権セミナー「AIと著作権」の講演映像及び講演資料より



❶ AI・人間どちらがデザインしても、類似しているかどうかが争点

❷ データセットはブラックボックスのため依拠性の証明が困難

❸ 生成画像をそのまま利用する場合は何かしらの類似チェックは行うべき

❹ 学習データが権利クリアされていない問題は、国内法律も問題ない

❺ 無断学習問題は、法律よりも感情的な部分で炎上リスクあり

❻ 法律的には正しくても、SNSから世論となり差し止めとなるケースはあるので注意が必要

❼ 生成AIが企業リスクとなるなら、アイデア出しに留めフィニッシュワークは人間が行う

AI開発段階における無断学習、著作権侵害については法律的に問題ないが、個々の感情的な問題などでSNSで炎上するリスクがある。また、AI生成による著作権侵害の判例が日本ではまだ存在しないため、今後の動向を見守っている現状。法律による詳しい内容はP.72で解説。

文化庁による令和5年度著作権セミナー「AIと著作権」の講演映像及び講演資料。最新の文化庁の見解がまとめられている。

homepage ● https://www.bunka.go.jp/seisaku/chosakuken/93903601.html