生成系AIまとめ!めちゃくちゃ種類多くて困っている人へ

COLUMN(コラム)
スポンサーリンク

 

おはようございます、モウリです

先日このようなツイートをしました。

ここ最近では、生成系AIのニュースが毎日飛び込んできます。
まさにトレンドなのでしょうね。

しかしながら、毎日最新情報を追っていると良くわからなくなってくる人も多いんじゃないでしょうか?
そこで本日は

  • 生成系AIまとめ
  • どんなAIツールがあるのか?
  • ビジネスや生活にAIを活用したい
  • 様々なAIツールがあるが一覧で見やすく欲しい

そんな人にオススメの内容になっています。

本当に毎週新たなAIツーつがリリースされております。
この記事がアップされる頃には、最新のAIツールがまたリリースされているかもしれません。

皆がスマートフォンを使用しているのに。
あなただけが未だにガラケーを使用している。
そんな状況にならないように。

日々のトレンドに目をやりつつ。
しっかりとついて行けるようになりましょう♩

生成系AIとは?

生成系AI(Generative AI)は、人工知能の一種であり、新しいデータや情報を生成する能力を持っています。生成系AIは、与えられたデータやパターンを学習し、それに基づいて新たな情報や内容を生成することができます。

生成系AIは、さまざまなタスクや応用に使用されます。例えば、自然言語処理の分野では、文章や対話の生成に使用されます。生成系AIは、学習したテキストデータから文章を生成し、自然な表現や意味を持った文章を生成することができます。

また、画像生成においても生成系AIは活用されます。学習データから画像の特徴やパターンを学習し、新しい画像を生成することができます。これにより、美術やデザインの分野で創造的な作品の生成や、仮想空間の作成などが可能となります。

生成系AIは、深層学習モデルの一種であるGAN(Generative Adversarial Network)やVAE(Variational Autoencoder)などのアルゴリズムを使用して実現されることが多いです。これらのアルゴリズムは、生成モデルと識別モデルの間で競争や協力が行われることで、より高品質な生成結果を得ることができます。

ただし、生成系AIは与えられたデータをもとに生成するため、学習データに偏りやバイアスがある場合、それが生成結果に反映される可能性もあります。また、生成された情報やデータの信頼性や正確性を確認する必要がある場合もあります。

生成系AIは、芸術、クリエイティブな領域やデザイン、仮想現実、自動コンテンツ生成など多岐にわたる応用が期待されており、今後のAI技術の進化とともにさらなる発展が見込まれています。

ちなみに上記の説明は全てChatGPTと言うAIツールを使用して作成してみました。
上記のようなAIを「テキスト型AI」や「対話型AI」などと言います。

ChatGPTについて詳しく知りたい方は。
過去に記事を挙げているので参考にしてみて下さい。

生成系AIまとめ

ここでは僕が実際に得た情報を元に、生成系AIをいくつかピックアップしようと思います。
ここで紹介しているAIツール以外にも様々リリースされております。

ご自身でも情報収拾を怠らないようにしましょう♩

対話型AI

先ほど紹介したChatGPT以外にも様々な対話型AIツールはございます。

AIによる自動応答を提供するチャットサービスは、ビジネスやカスタマーサポートにおいてますます重要な役割を果たしています。
そして、最近話題のChatGPTは、OpenAIが開発した大規模言語モデルの一つで、ビジネスへの活用も進んでいるところです。

しかし、ChatGPT以外にもAIチャットサービスはあります。
それぞれのサービスには特徴があり、用途に合わせて選ぶことが重要です。

1.信頼性の高い情報を提供してくれる「Perplexity AI」


画像出典:Perplexity AI

「Perplexity AI」は、2022年12月に発表された会話型検索エンジンです。
Perplexity AIは生成系AIサービスの一つで、アカウントを作成することなく利用できます。

UIはGoogle検索のようにシンプルで、「Ask anything…」と表示された入力フォームに調べたいことや質問を入力すると、それに対する応答結果が返されます。

Perplexity AIの大きな特徴は、応答結果の文章の出典となるソース情報が明記される点です。
そのため、応答結果が本当に正しいのかを判断しやすくなっています。
また、追加の情報入力や関連事項の検索ができるようになっており、情報の深掘りが可能な点もChatGPTと異なる点といえるでしょう。

さらに、Perplexity AIは高速なWebクローリングによって、ネット上にある情報を収集・要約した文章を返してくれます。
これにより、最近の話題に関する質問ではChatGPTよりも応答精度が高くなる傾向があります。

2.GPT-4を無料で利用できる「Bing」


画像出典:Qbook

マイクロソフトが提供する検索エンジン「Bing」には、AIとのチャット機能があります。
この機能は「Bing AI」と呼ばれ、人の代わりにAIが検索して質問に答えてくれます。

Bing AIの最大の魅力はGPT-4を無料で利用できることです。
GPT-4はOpenAIが手がける大規模言語モデルの最新バージョンで、性能や信頼性においてChatGPTのベースモデルであるGPT-3.5を格段に上回っているとされています。

GPT-4を利用する方法は、有料の「ChatGPT Plus」に登録するか、無料で利用可能なBingを利用するかの2つです。
つまり、GPT-4を無償で試したい場合は、Bingを利用することが唯一の選択肢です。

3.音声入力が得意な「ChatSonic」


画像出典:ChatSonic

「ChatSonic」は、画像生成機能や音声コマンド機能、テキスト生成機能、ライティングの提案機能などを持った対話型AIチャットサービスです。

画像生成機能では、プロンプトを入力するだけで、詳細な指示に基づいたアートワークや画像を生成できます。
音声コマンド機能により、テキスト入力とは異なる方法でChatSonicに指示を与えることも可能です。

テキスト生成機能を使えば、自然言語処理と機械学習を使って、ブログ投稿や製品説明、ストーリーやポエムなどのテキストベースのコンテンツも生成できます。
さらに、ライティングの提案機能により、文章へのアドバイスやアイデア、文法や誤字のチェックなどを受けることも可能です。

ChatSonicは、テキストや音声による自然な会話で、さまざまなニーズに応えられる対話型AIチャットサービスといえるでしょう。

4.検索ポータルに組み込まれた「YouChat」


画像出典:YouChat

「YouChat」は、You.comという検索エンジンの一部として提供されています。
You.comのトップページにあるキーワード入力欄にキーワードを入力すると、そのキーワードに関連する検索結果とともに、YouChatによる回答が表示されます。さらに、その回答欄からそのまま会話を続けることも可能です。

また、YouChatは最新のニュースや情報源を常に引用しているため、時事的な問題が得意とされています。
論理的なクイズにも強く、ChatGPTよりも論理的な推論を使用した問題解決に役立ちやすいでしょう。

ただし、YouChatはベータ版となっており、現状ではその正確性への問題を指摘する声も少なくありません。
特に、日本語の質問に対しては誤答が多い傾向がみられます。
なお、You.com側も、生成されたコンテンツに対して責任を負わないことを明言しています。

5.文章生成が得意な「Google Bard」


画像出典:Google Bard

2023年3月に一般公開された「Google Bard」は、新たに人工知能(AI)を用いた対話型検索サービスです。
これまでの検索方法と異なり、ユーザーが自然な文章でAIに質問をすることができ、さらに、AIがビッグデータを用いた正確な回答をしてくれます。

Googleが開発する大規模言語モデル「LaMDA」の活用が、さまざまな質問に対する柔軟な回答を可能にしました。
Googleは、Bardを「詩人(Bard)」のように受け答えしてくれるものと位置づけています。
ユーザーの質問に答えるだけではなく、文章を作成・校正したり、小説や詩を創作したりするなど、人間の会話のような自然な文章生成が期待されているのです。

Bardは2023年3月21日にアメリカとイギリスでベータ版が一般公開されており、現在は無料で利用できます。ただし、2023年4月時点では日本語には非対応です。

6.ワークスペース上で利用できる「Notion AI」


画像出典:Notion AI

「Notion AI」は、人気のタスク管理アプリ「Notion」のワークスペース上で利用できるAIツールです。
自然な文章を生成することで、業務効率化や生産性向上が実現できます。

Notion AIのシステムの基盤は、OpenAI社が開発した自然言語処理モデル「GPT-3」です。
そのため、「Notion AI」と「Chat GPT」はおおもとの処理モデルが同じであり、文章生成に特化したAIツールといえます。

Notion AIは、執筆に数時間を要する長い文章でも数十秒~数分で自動生成が可能な上、まるで人間が書いたような自然な文章である点が大きな特徴です。
ただし、現時点では正確性に欠ける部分もあるため、Notion AIを使って作成した文章は、人間の手で推敲する必要があるでしょう。

7.汎用性が高い「ChatGPT」


画像出典:Qbook

「ChatGPT」は、OpenAI社が開発した自然言語処理のモデルであり、学習データに含まれる膨大な量のテキスト情報をもとに自然言語処理を行うことができます。
そのため、汎用性が高く、文章生成や文章修正、翻訳、要約、問答応答など、幅広い分野で活用できます。
例えば、ChatGPTはWeb上の大量のテキストデータから、指定したテーマやキーワードに関連する文章を生成したり、要約文を生成したりすることも可能です。

また、ChatGPTはユーザーのフィードバックを繰り返し学習するアルゴリズムが採用されているため、繰り返し使用することで、より精度の高い回答が期待できます。
さらに、ChatGPTは、その分かりやすい操作性も魅力です。登録をすればチャット欄への入力だけで質問や指示に対応した回答が得られます。

このように、ChatGPTは高い汎用性や使いやすさから、さまざまな分野での活用が期待されています。
今後も、より高度な自然言語処理技術の開発が進むことで、より多くの分野で活用されることでしょう。

画像生成AI

正直画像生成AIは多すぎるのと、かなり細かいので。
追いついてない部分もあります。

画像生成AIとは、生成したいイメージをテキストで入力すると、イラストをAIが自動で生成してくれるというもの。

画像生成AIでは、サービスによってイラストの画風なども指定することが可能です。
「Pixel Art」や「Psychedelic」など数十種類の画風から選択できるものもあり、例えばAIお絵描きアプリ「AIピカソ」では、「3Dゲーム」や「サイバーパンク」、さらにはフリーのイラストサイトとして著名な「いらすとや」風のイラストなど、計7種類のスタイルが用意されています。

ここでは一部となりますが、ご紹介します。

1.Novel AI


画像出典:NovelAI

アメリカに拠点を置くAnlatan社が提供する「Novel AI」。
アニメのようなイラストの生成が得意なオンラインサービスです。
高いクオリティを誇りながら、スマホや低スペックのパソコンでも使用可能なため、初心者にもおすすめ。
利用には有料のサブスクリプション登録が必要です。

POINT
・アニメのようなイラストに強く、クオリティが高い
・スマホ・低スペックPCでも使える
・利用にはサブスクリプション登録する必要がある

2.Stable Diffusion


画像出典:Stable Diffusion

「Stable Diffusion」はとにかく多機能で、複数のAIモデルを切り替えて使用できたり絵柄をカスタマイズしたりすることが可能。
本格的にAIイラストをやりたい人におすすめです。
また、無料で使うことができるのも大きなメリット。
ただし、高性能な分、導入にはある程度のパソコン知識が必要なため、パソコンが苦手な方にとっては敷居が高いかもしれません。

POINT
・高クオリティかつ高機能
・無料で上限なく使用できる
・導入するにはパソコンの知識が必要

3. にじジャーニー(nijijourney)


画像出典:にじジャーニー

「Midjourney」をベースに、よりアニメ調の絵柄を強化したAI画像生成サービスが「にじジャーニー(nijijourney)」です。
本格的なAI画像生成サービスには珍しく、テキストを日本語で入力してもOK。
また、手の形がおかしいなど、破綻した絵が生成されることが少なく、AIの性能の高さがうかがえます。
1つのアカウントにつき無料で生成できる回数は25回まで。
それ以上は有料サブスクリプションの加入が必要です。

POINT
・破綻した絵が出にくい
・テキストを日本語で入力してもOK
・無料で生成できる枚数に上限がある

スポンサーリンク

4. お絵描きばりぐっどくん


画像出典:お絵描きばりぐっどくん

LINEでAIイラスト生成を楽しめる「お絵描きばりぐっどくん」。公式LINEを友だちに追加した後、トーク上でテキストを送信するとAIがイラストを送ってきます。
こちらはとにかくお手軽でわかりやすいのが特徴。
その分細かな条件の調整が難しく、想定外の変わったイラストが生成されることも。

POINT
・スマホで簡単に生成可能
・変わったイラストができることも
・細かな条件設定ができない

5. AIピカソ


画像出典:PRTIMES

AIアバターを作成できるアプリとして有名で人気のある、「AIピカソ」について紹介します。
「AIピカソ」は、単語を入力し、希望のスタイル(絵柄)を選択するだけで簡単に生成してくれるAIお絵描きアプリです。
昨年末には、「いらすとや」とコラボをし、いらすとや風のイラストを生成する「AIいらすとや」をリリース。
また、直近の新しい機能として、”AIアバター”が生成できるサービスもリリースされました。

POINT
・スマホで簡単に作れる
・「いらすとや風」の絵柄が選べる
・イラストの詳細設定ができない

▼iOS版
https://apps.apple.com/app/ai-picasso-dream-art-studio/id1642181654

▼Android版
https://play.google.com/store/apps/details?id=com.aidealab.aipicasso

6. HolaraAI


画像出典:HolaraAI

022年12月にサービスを開始した「HolaraAI」。
アニメ系のイラストが得意なサイトですが、背景のクオリティがとても高く風景画や背景素材の生成にも活用できるのが特徴です。
機能の1つである「ランダム生成」は、自動でテキストを組んでくれるのでワンクリックでイラストの作成ができます。
無料プランではこの「ランダム生成」のみ使用可能。
希望するイラストを指定したい場合は、有料プランに加入する必要があります。

POINT
・風景画や背景素材の生成が得意
・自動でテキストを作ってくれる
・無料プランでは自分の出したいイラストが出せない(ランダム生成のみ)

7. mimic


画像出典:mimic

海外企業によるサービスが主流な中、日本企業によって提供されている「mimic」は、ユーザーが自分の絵をAIに学習させて、その作風の絵を生成するサービス。
利用には事前審査を通過する必要があり、クリエイター活動を行っている人のみ利用可能です。
「学習に利用したイラストは公開」、「生成した画像にはロゴの透かしが入る」などの不正対策で、クリエイターを守るための体制が整っているのが特徴です。

POINT
・日本企業によるAI画像生成サービス
・クリエイターを守るための体制が整っている
・クリエイター活動をしていない人は利用できない

8. Midjourney


画像出典:Midjourney

Midjourneyは、2022年7月末頃から公開されているAIイラスト作成用ツール。

描きたいイラストのキーワードや説明文章をAIが分析し、数十秒~数分程度でイラストを作成してくれます。
得意な画風は、風景画や肖像画といったリアル寄りといわれています。
国内外にユーザーが多い、もっとも有名な画像生成AIサービスのひとつと言えます。

ツールがDiscord上に設置されているのが特徴で、使うにはDiscordのアカウントを用意する必要があります。
とはいえ、登録からログインまでものの2~3分程度で終わるのでそこまで手間はかかりません。

9. DALL E2


画像出典:DALL E2

2022年4月頃にβ版がスタートした画像生成AIサービス。

非営利の人工知能研究団体OpenAIが手掛けるDALL E2は専門家や研究者といったプロの需要を満たすツールとして作られました。
テキストによる画像生成に加え、編集機能に長けているのがこのDALL E2です。

10. Dream by WOMBO


画像出典:Dream by WOMBO

カナダの企業WOMBが贈る、無料の画像生成AIサービス。
ブラウザ版だけでなくスマホアプリもリリースされているので、お好みのデバイスでAI画像生成を楽しめます。

その最大の特徴は文章を入力する際に、用意されている6つのアートスタイルを選べる点が挙げられます。Retro、Paint、Polygon、Line-Art、Comicなどなど……さまざまな画風を先に選んでから生成をする事ができるので、より柔軟にイラスト生成を実行する事ができます。

650円/月の有料プランに加入すれば、イラストを動画として出力するサービスも使用できます。

11. Leonardo.Ai


画像出典:Leonardo.Ai 

画像生成 AIを無料で使う方法はたくさんありますが、ハイスペックなPCが必要だったり、インストールのための環境構築が面倒だったりすることも。
Leonardo.Ai はとにかく誰でも簡単に始められます。

  • ブラウザ系アプリなので低スペックPCでもOK
  • 無料プランでも1日最大150枚生成可能
  • 商用利用可能
  • image to image、AI Canvasなど、豊富な機能
  • 豊富な生成モデルを利用可能(Platform Model/Community Models)
  • 独自のファインチューニングも可能

12. Bing Image Creator


画像出典:Bing Image Creator

Microsoft社が(米国時間)にBingAIのチャットを通して画像を生成できる「Bing Image Creator」を公開しました。
Bing Image Creatorは、ChatGPTでお馴染みのOpenAIが開発した画像生成モデルである「DALL-E」の先進バージョンを搭載した、高性能の画像生成ツールとなっています。

13. AIイラストくん


画像出典:AIイラストくん

「AIイラストくん」は、話題の画像生成AI”Stable Diffusion”を利用してLINEで簡単にイラストを作成できるサービスです。
LINEで友達追加をし、テキストで生成したいイラストの説明を入力することで、簡単にイラストを作成してくれます。

これまではクオリティの高い画像を生成するためにはGPUやメモリなど高いスペックを持ったPCと、プロンプトなどの専門知識が必要でしたが、LINEで簡単に日本語で利用することができるため、誰でも手軽にご利用いただくことが可能となりました。

1日3回まで無料で利用することができ、月1280円のプレミアムプランに加入すると回数無制限でご利用いただけます。

現時点では「イラスト」「人物」「風景」に特化した学習モデルを用意しており、順次対応ジャンルを増やしてまいります。

こちらは招待制になっており、招待コードを持っている人から招待してもらわないと使用できないです。
僕は招待して頂いており使用できます。
招待枠が残り5枠ありますので、使用したい方は僕TwitterよりDM下さい。
枠が残っていれば、提供いたします。

14. Adobe Firefly


画像出典:Adobe Firefly

Adobeが画像生成AI「Firefly」を発表。ベータ版としての提供が開始されました。

「Stable Diffusion」や「midjourney」といった有名な画像生成ソフトがありましたがトレーニングデータの著作権などの問題もあり本業のクリエイターは利用しにくくなっていました。

安心して使えるAdobe製の画像生成は長らく期待されていましたが、満を持してリリースされました。

VR画像生成AI

これびっくりするんですけど。
文字を入力するだけで、360°パノラマの画像を生成するAIです。

ただ個人的にこのVR画像の使用用途がわからない。
このVR画像を活用事例があったら教えて下さい。

1. Latent Labs


画像出典:Latent Labs

AIを活用した新しいツールを作成することを目的としたチーム Latent Labs による、360度パノラマ画像を生成することができるウェブツールの紹介です。

このLatent Labsの新しいツールは、Stable Diffusionの上に構築され、360度パノラマ写真を生成することができ、カメラアングルをインタラクティブに変更することが可能です。

2. Skybox Lab


画像出典:Skybox Lab

Skybox LabとはWebブラウザ上でテキストを入力すると、AIが3D空間を自動生成してくれるツールのことです。
360度使えるVR空間のような世界が魅力的!アニメーション風から写真風のものまで、さまざまなパターンを指定できます。

動画生成AI

画像生成AIの発展形として、動画生成AIも登場しています。
例えば、前述の「Stable Diffusion」の開発元は、入力した動画を全く新しい動画に作り替えることができる「Gen-1」というAIモデルを開発しています。

「Gen-1」を活用した動画生成AIとして、Meta社の「Make-a-Video」やGoogle社の「Phenaki」などが挙げられます。
これらの動画生成AIでは、テキストで生成したい動画のイメージを入力すると、そのイメージに沿った短い動画を生成できるという仕組みです。

「既存の映像を変換する」という性質上、長い尺の動画を生成できるようになる可能性も秘めており、さらなる進化が期待されているジェネレーティブAIです。

1. Cuebric


画像出典:Cuebric

米マサチューセッツ拠点の企業Seyhan Leeが開発したCuebricという生成AIツール。

Cuebricは、生成AIが生成した背景映像をスクリーンに映し出すAIツール。
上記でも触れた画像生成AI、Stable Diffusionのモデルをベースとしており、たとえば「アワード受賞作品のような背景」というテキスト(プロンプト)を入力し、さらにそれぞれの要望に応じ「シネマティックな山と川」など、具体的なプロンプトを入力していくと、高画質な背景ができあがる。

Stable Diffusionモデルをベースとしているが、静止画のみの生成にとどまらない。
背景の一部、たとえば雲などの動きをアニメーションに変換することも可能といいます。

2. Flawless


画像出典:Flawless

ハリウッド映画の監督/プロデューサーとしての経験を持つスコット・マン氏が共同創業したFlawlessは、吹き替え版の言葉から、口の形をAIで生成し、合成するAIツールTrueSyncを開発した。
すでに、ポストプロダクション関連の企業で幅広く導入されているという。

同社のこの技術は、映画の中の過激な言葉を取り除くという別の用途にも活用されている。
検閲リスクがある場合、迅速に過激発言を取り除くことで、年齢制限を緩和することが可能となる。

一方、このような誰かの声を生成する技術は、便利である反面、倫理的な問題も提起されている。

実際、米国の作家アンソニー・ボーデイン氏のドキュメンタリー番組では、すでに亡くなっているボーディン氏の声が生成AIで生成され、番組ナレーションに利用された。
ボーディン氏の同意なしに生成された音声を利用することが倫理的に正しいのかどうかなどの問題提起がなされた。

スポンサーリンク

3. Gen-1


画像出典:Runway

「Runway」は、テキストから画像を生成できるAI「Stable Diffusion」を、Stability.AIと共同開発した企業。
そんな彼らが、自社で保有する技術力を駆使して開発したのが「Gen-1」。

このAIは動画に映る人々をクレイアニメに出てくるような人形に、テーブルに置いてある本を高層ビルに変えられる。

4. Kaiber


画像出典:Kaiber

Kaiberは、映像クリエイター向けのAIツールです。このツールを使用することで、映像制作の効率性を高めることができます。

映像編集の自動化を可能にする機能を持っており、具体的には、映像素材から自動的にシーンを抽出し、それらを自動的に編集することができます。
また、音声解析機能を使用して、映像に合わせた音声トラックを自動的に作成することもできます。
Linkin Parkの公式MVにも使用され話題になりました。

5. Vrew


画像出典:Vrew

Vrewとは、AIが動画の音声を自動で認識をし、字幕を作成してくれるソフトです。なんと無料で利用できます。

他にも、動画の無音部分を自動でカットしてくれる機能があったりとかなり使えるソフトです。OSはWindowsでもMacでもどちらでもOKです。

6. PictoryAI


画像出典:PictoryAI

PictoryAIは、画像認識をより身近にするための人工知能技術です。写真や動画に写っている物体や人物、シーンなどを、これまで以上に高い精度で認識できるようになります。

業務用、個人用を問わず利用することができます。また、費用対効果や精度の高さから、従来の画像認識手法に代わる望ましい手法として注目されています。

そして主なユーザーでの使われ方は、AIによる動画自動作成です。

テキストやファイルを選択するだけで、簡単に動画にしてくれます。なんとブログやホームページからも動画を自動生成してくれるのです。さらに、動画からの文字起こしまでも自動でしてくれます。

アバター生成AI

YouTubeなどを見ているとたまにアバターが解説してくれている動画などを目にします。
最近では、ニュースの内容をアバターが喋るなんて事もありますね。

アバターとは特定の人物をもとに作られた架空のキャラクターのことです。
一般的には、ゲームやSNSなどの仮想空間でプレイヤー自身が操作するキャラクターに使用されることが多いです。

AI(人工知能)技術を用いることで、自分自身の写真から顔、体型、表情などの特徴を正確に抽出できるようになります。
その結果、ユーザー独自の自然な表情を持つ「AIアバター」の作成が可能になりました。

最近の写真加工アプリやSNS系アプリの多くにはAIが搭載されているため、アプリをダウンロードするだけで簡単に自分の「AI」アバターが作れます。

1. Creative Reality Studio(D-ID)


画像出典:Creative Reality Studio(D-ID)

イスラエルのAI関連企業Studio D-IDは、テキストを打ち込むことで、アバターやアニメーション作成を行えるプラットフォーム「Creative Reality Studio」を発表しました。
組み込まれているシステムには、画像生成AIの「Stable Diffusion」も含まれます。

2. Elai.io


画像出典:Elai

Elaiは、文章から動画を作成してくれるAIツールです。これまで紹介してきたAIツールの中でも、Synthesiaに近い機能を持っています。
文章を入力すると、リアルな人間のアバターが文章を読み上げる動画を作成することができます

3. AI Studio


画像出典:AI Studio

AI STUDIOSは、ユーザーがスクリプトを入力するだけでAIヒューマンを主役にした動画を制作できる最高の動画合成プラットフォーム。
月額利用料型のSaaS(Software as a Service)プラットフォームとして提供され、中小企業(SMB)はコスト効率よくAIヒューマン技術を利用できるようになる。
このプラットフォームは、俳優、カメラ、制作クルーなしでカスタムビデオコンテンツを制作する。

AI STUDIOSは、2021年6月にベータ版サービスとして初めてオープンして以来、韓国、米国、オーストラリア、中国、東南アジアで3万人以上の加入者を獲得。
累計ビジター数は50万人を超える。

4. synthesia


画像出典:synthesia

AIアバター生成・AI音声生成・動画編集、の全てが行える、AIプレゼン動画作成プラットフォームです。
AIアバターやAI音声を生成できるサービスは他にも存在しますが、動画編集までもができるプラットフォームである、という事がSynthesiaの一番の特徴です。

プレゼン動画に特化しているため、パワーポイントのファイルをそのままインポートできます。
また、編集方法や編集画面のUIも、パワーポイントやCanvaなどに似ているため、すぐに使い慣れる方が多いでしょう。

5. invideo


画像出典:invideo

invideoとは、オンライン上で動画編集ができるサービスのことで、無料で使用できるものになります。無料版と有料版があり、無料版は一部制限があるものの基本的な編集作業は行えるので、SNS用や動画サイト用のショートムービーの作成には最適です。

作成した動画の著作権はユーザーに付与される点も、手軽に動画発信を行いたいユーザーには使いやすい点となっています。

音声生成AI

音声合成を活用することで、人による情報の読み上げ作業を省略化できる可能性があります。適用の範囲が非常に広く、市場も大きいことから各業界から注目されているのです。最近では、ディープフェイクと呼ばれる動画生成技術の根幹をなしています。

音声合成の手法のうち、任意のテキストを音声に変換する方法を、「テキスト合成音声(Text-to-Speech)」といいます。AIによる音声合成を実現するためには、そのAI構築に欠かせない学習データの作成(アノテーション)も必要な作業です。

1. Coqui


画像出典:Coqui

Coquiは、元Mozillaエンジニアが2016年に立ち上げたテキスト読み上げAIサービスを提供する企業です。
このサービスを使いテキストを入力すると、まるで人間が喋っているかのような音声を生成する事ができます。
生成できる音声はまだ英語のみですが、現在開発中の料金プラン「Pro」で今後複数の言語に対応していくようです。

2. 音読さん


画像出典:音読さん

音声読み上げソフト「音読さん」は、無料で毎月5000文字をAI音声で読み上げできます。
MP3を簡単にダウンロードできて、商用利用も可能です。
ChatGPTと無料で会話ができる拡張機能(Ondoku3-ChatGPT)など便利機能がたくさん。

3. CoeFont


画像出典:CoeFont

CoeFont(コエフォント)とは、1回500円・約15分という低価格かつ短時間の収録で、AIが自分の声を自然な発声のできる音声合成に変換してくれるWebサービス。
作成したCoeFontはクラウド上で公開することができ、他のユーザーの1,000種類以上のCoeFontを利用して音声合成をすることも可能。
作成したCoeFontが利用されるたびに、CoeFontの作成者に収益として還元される仕組みとなっている。
既に多数著名人のCoeFontが公開されており、今後プレゼンやゲーム実況動画、アニメのアフレコといった様々な用途に活用されることが期待されている。

4. VOICEVOX


画像出典:VOICEVOX

VOICEVOX(ボイスボックス)とは、ヒホ(ヒロシバ)が開発したフリーのテキスト読み上げ用音声合成ソフトウェアです。

5. COEIROINK


画像出典:COEIROINK

COEIROINKとはシロワニさんが開発・公開している無料トークソフトブランド。
読み方は「コエイロインク(こえいろいんく)」「声色インク(声色いんく)」となり、「コエイロリンク」ではない。
シロワニさんは以前にも「つくよみちゃんトークソフト」など音声合成ソフトを開発しており、COEIROINKはそれらで培った技術を集約した完成形ソフトと言えます。

6. VOICEPEAK


画像出典:株式会社AHS

『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。
お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。
感情パラメータによる喜怒哀楽の表現にも対応しています。

音楽生成AI

AIは音楽の分野でも作曲、ビートメイキング、ミキシング&マスタリング、音楽ストリーミングなど、音楽制作プロセスのあらゆる側面に影響を与える技術が登場しています。

AI作曲ソフトを導入することで、ゼロから瞬時にトラックを制作したり、ミュージシャンの創造的なプロセスを補助する為にも利用できます。

1. Amper Music


画像出典:Amper Music

最高のAI音楽ジェネレーターのサービスとして認知度の高かった「Amper Music」は、2020年に世界最大の画像プラットフォームを運営する「Shutterstock」と統合することでより強化されました。

特にShutterstockのアーティストコミュニティによって作成されたトラックのコンテンツ検索と発見、および Shutterstockユーザー向けの編集ツールにおいて、人工知能機能が強化されます。

オーディオデータは雰囲気、使用楽器、音楽キー、テンポ、などを変更可能です。

2. Soundraw


画像出典:Soundraw

Soundrawは2020年よりサービスを開始し、AIが作成したフレーズ等を使って曲をカスタマイズできます。

AIによって無数に生み出されるフレーズを組み合わせて、楽曲の尺や構成、楽器、テンポなどを自由にカスタムすることによって、オリジナル楽曲を簡単に制作することができます。

3. AIVA


画像出典:AIVA

2016年に開発された音楽ジェネレーターサービス「AIVA」はAI機能を使って、広告、ゲーム、映画などのサウンドトラックを構成するのに適しています。

AIVAを使用することで、ユーザーは音楽をゼロから作成することができ、他にも既存の曲のアレンジバリエーションを構成するのにも役立ちます。もちろん音楽のライセンスについて心配する必要はありません。

最初にプリセットスタイルを選択するだけで、さまざまなジャンルやスタイルの音楽を簡単に生成することができます。

4. Amadeus Code


画像出典:Amadeus Code

2021年にサービス開始した「Amadeus Code」はAIによって自動作曲を行い、作曲の支援をしてくれるという、実用的かつ画期的なサービスとして注目を集めました。

iOSのアプリにも対応しており、簡単な操作だけで数分で新しいメロディーを作成することができるので、作曲初心者にも最適です。

5. Music LM


画像出典:Music LM

Googleの研究部門である「Google Reseach」が、入力したテキストから内容に即した音楽を生成するAIツール “Music LM”を論文形式で発表しました。

「歪んだギターリフに裏打ちされた落ち着いたヴァイオリンの旋律」 などのテキスト記述から忠実度の高い音楽を生成することができ、周波数は一貫して24kHzの音質を保っており、ロックや電子音楽など様々なジャンルに対応。

28万時間にもおよぶ音楽のデータセットで学習したAIを用いて、入力された文章からその内容を忠実に再現した音楽を作成することができます。

スポンサーリンク

6. Ecrett Music


画像出典:Ecrett Music

Ecrett Musicは直感的でわかりやすいインターフェイスと、シーン、感情、ジャンルといった豊富な選択肢から楽曲を選べるので、アマチュアにもプロにも最適なAI音楽生成サービスです。

数回のクリックだけで、楽器や曲構造を簡単にカスタマイズすることもできます。また、さまざまな機能や特殊効果が備わっているのも大きな特徴の一つ。

トラックにはメロディー、バッキング、ベース、ドラムが含まれます。

7. Boomy


画像出典:Boomy

クリエイターの音楽制作への参入障壁を下げることに対して、重要な役割を果たすツールの1つがこの「Boomy」です。

数秒でオリジナル曲を作成できる手軽さと、作成した曲を送信して、さまざまなストリーミングサービス収益を得る可能性がある、非常に画期的なツールになります。

作成時にはいくつかのフィルターを設定して「曲を作成」 をクリックすると、ツールのクリエイティブな人工知能が数秒で完全な曲を作成します。

8. MuseNet


画像出典:MuseNet

AI業界で最も権威性のある名前の「OpenAI」 は、MuseNetと呼ばれる独自のオンラインAI音楽生成ツールを開発しました。

MuseNetは、10種類の楽器で4分間の楽曲を生成し、カントリーからモーツァルト、ビートルズまでのスタイルを組み合わせることができるディープニューラルネットワークシステムです。

数十万のMIDIファイルからメロディーやコード進行を予測することを学習して、ハーモニー、リズム、スタイルのパターンを見つけ出します。

9. Jukebox


画像出典:Jukebox

こちらも「OpenAI」を使用した音楽自動生成サービスで、ジャンルとアーティストを選ぶだけで作成・作曲を自動生成する技術「Jukebox」を発表しました。

インターネットをクロールすることで収集した約120万曲のデータセットを作成し、それに対応する歌詞、LyricWikiからのメタデータとペアにします。

通常の音楽生成に必要なデータだけでなく「その曲が生まれた年」「アーティスト」「ジャンル」といったメタデータとともに学習することで、楽曲の特徴まで学習することができるのが特徴です。

10. Soundful


画像出典:Soundful

ボタンをクリックするだけで、AIテクノロジーを使ってビデオ、ストリーム、ポッドキャスト等のロイヤリティ フリーのBGMを生成できるサービスです。

さまざまなテーマとムードの中からテンプレートを指定することで、目的のトラックが見つけやすく、テンポ、キーを指定して作成することもできます。

EDMやヒップホップビート等、即戦力となる本格的なトラックが作れます。

11. Voicemod


画像出典:Voicemod

Voicemodはテクストから音楽を生成することができる、ブラウザベースのAI音楽ジェネレーターです。

AIの力を使ってあらゆるテキストを歌唱させることが可能で、ポップ、トラップ、ヒップホップ、クラシック等の様々なジャンルに対応した7人のシンガーから選択することができます。

どのデバイスからもアクセスできるので、場所を選ばずに作曲を楽しむことができます。

12. Melobytes


画像出典:Melobytes

Melobutesは、音楽スタイル、テンポ、言語、歌詞など、様々な音楽情報を入力することで独自の曲を生成してくれるアプリです。

他にも、コード進行生成や歌詞生成、リフ生成など、様々な作曲に役立つツールを提供してくれています。

他のAI音楽生成ソフトと比べて動作が軽く、音楽生成までの時間も短いので、サクっとBGMを作りたいようなシーンで役立ちます。

13. CREEVO


画像出典:CREEVO

CREEVOを使えば、入力した歌詞からオリジナルのメロディーを簡単に作成することができます。

利用者の評価を基準にして、新しい自動作曲モデルが生まれ続ける仕組みで、利用者が多いほど高品質で新しい音楽が創作できるようになるといった概念のもと運営されています。

CREEVOは既存のAI技術よりも優れた、文化の創造と進化を支える人口知能の仕組みを理解するための研究プロジェクトの一部として運営されています。

14. FIMMIGRM


画像出典:FIMMIGRM

FIMMIGRMは数々のヒットソングのトラックを分析・学習させた「AIトラックジェネレーター」として機能します。

難しい操作をすることなくAIが自動的に作曲してくれるので、ハイクオリティなオリジナル曲を素早く入手することができます。

購入したトラックは、音声ファイルだけではなく、MIDI もダウンロードが可能。気になったトラックをさらにDAWで編集することも可能。

参考文献:QbookチエネッタUZUREA.netChatGPTの教科書TRIVISION STUDIO 

まとめ

本日は以下について解説いたしました。

  • 生成系AIとは?→人工知能の一種であり、新しいデータや情報を生成する能力を持っています。生成系AIは、与えられたデータやパターンを学習し、それに基づいて新たな情報や内容を生成することができます
  • 対話型AI→チャットサービスのようにAIと文章を通じて回答を得る
  • 画像生成AI→生成したいイメージをテキストで入力すると、イラストをAIが自動で生成してくれるというもの。
  • VR画像生成AI→文字を入力するだけで、360°パノラマの画像を生成するAIです。
  • アバター生成AI→アバターとは特定の人物をもとに作られた架空のキャラクターのことです。
    一般的には、ゲームやSNSなどの仮想空間でプレイヤー自身が操作するキャラクターに使用されることが多いです。
  • 音声生成AI→声合成の手法のうち、任意のテキストを音声に変換する方法を、「テキスト合成音声(Text-to-Speech)」といいます。
  • 音楽生成AI→AIは音楽の分野でも作曲、ビートメイキング、ミキシング&マスタリング、音楽ストリーミングなど、音楽制作プロセスのあらゆる側面に影響を与える技術が登場しています。

かなりボリューミーな内容でしたがついて来れていますでしょうか?
一覧で見るとかなり見やすいですよね?
たくさん情報がある中で、「どれがどうだっけ?」が解消されるかな?と思います。

ちなみに今回ご紹介した物はほんの一部です。
まだまだ沢山ツールは存在します。

プレゼン資料などもAIですぐに作れてしまう物もあります。

ご自身でも情報をキャッチアップして時代に取り残されないようについて行きましょう♩
もちろん日々情報をアップデートとしてこちらのブログでもご紹介いたしますね。

是非今後の更新もお楽しみください♩

今回も最後までお読み頂き誠にありがとうございます。

スポンサーリンク
ITスクール【ネットビジョンアカデミー】

COLUMN(コラム)
スポンサーリンク
\シェアする/
Kazuhiro Mouriをフォローする
30代のためのファッションWEBメディア

StyleWear(スタイルウェアー)|30代のためのファッションWEBメディア
【全くの「おしゃれ」初心者が0から、このWEBメディアを通じて「おしゃれ」になる】をコンセプトとし。

・ファッション
・ビューティー
・ライフスタイル
・ヘルスケア
・ファイナンシャル

などの知識を得るための様々なコンテンツを配信しております。

KazuhiroMouriBlog

コメント