生成AIの種類まとめ一覧|サービスの特徴・仕組みやできることを解説

この記事でわかること
- 生成AIにはどんな種類があるのか
- 生成AIを活用するメリット
- 生成AIを使用する際の注意点
「スマート書記」を無料で14日間試してみる or 資料を請求する
「生成AI」という単語を耳にする機会は急速に増えてきて、身近に感じられる人も増えてきたのではないでしょうか?生成AIは、テキストや画像、音声や動画、はたまた音楽まで、自動で生成できる技術であり、ビジネスだけでなくクリエイティブな分野で広告に使用されたりなど、革新をもたらしています。
しかし、「そもそも生成AIとはなにか」「どういった種類があるのかよくわからない」「どのように活用できるのか知りたい」といった方も多いのではないでしょうか?
本記事では、生成AIとはなにか、という基本的なところから、生成AIの種類、生成AIを活用するメリット、また、生成AIを使用する際の注意点まで、その全貌をわかりやすく解説していきます。
生成AIにはどんな使い方や可能性があるのか、効果的に活用していくための第一歩として、本記事を参考にしてみてください。
- 会議後のまとめ作業に時間がかかっている
- 会議中のメモが大変で追いつかない
- 議事録作成後の言った言わない問題の確認が大変
このような議事録に関するお悩みがあれば、ぜひ一度AI議事録サービス「スマート書記」をお試しください。
スマート書記は議事録などのドキュメント作成に関する作業を自動化・効率化することができ、作成時間を最大90%以上削減することが可能です。
生成AIとは
生成AIは、人工知能の一種です。大量のデータを学習させることで、データの背後にあるパターンや構造を学習して、新しいテキストや画像、音声、動画などを生成するAIのことを指します。ただ単に学習した既存のデータを再現するわけではなく、学習したパターンに基づいて、新たなものを生み出すといった創造的なAIとなっています。
以下の記事で生成AIについて詳しくご紹介していますので、参考にご覧ください。
生成AIの7つの種類
生成AIの種類は多種多様であり、種類によって得意としている分野が異なります。今回の記事では、
- テキスト生成AI
- 画像生成AI
- 音声生成AI
- 動画生成AI
- 3Dモデル生成AI
- プログラム・コード生成AI
- 音楽生成AI
のそれぞれの種類で、代表的な生成AIをご紹介します。ぜひ導入の参考にしてみてください。
1. テキスト生成AI
テキスト生成AIは、その名の通りテキストコンテンツの作成をはじめとして、翻訳や要約、文章の構成や、プログラミングコードの生成をチャット形式で行うAIです。ブログ記事の作成やメールの文章を考えたり、プログラミング支援として活用できる生成AIです。
ChatGPT
生成AIと言えば、耳にすることの多いのがChatGPTなのではないでしょうか。ChatGPTとは、アメリカのOpenAI社が開発した大規模言語モデルAIで、人間のように自然な会話ができるAIチャットサービスのことです。気になることをChatGPT上で質問しながら情報収集をしたり、テキスト情報を加工したりすることができます。
登録をするだけで無料で利用することができ、ChatGPTがリリースされてから5日間で登録ユーザー数が100万を超えるなど、その技術・革新性から近年注目を集まっているサービスです。
Gemini
GeminiとはGoogleが開発した生成AIモデルで、2023年末に「Bard」という名称で提供が開始され、2024年2月に「Gemini」にサービス名が変更されました。
開発元がGoogleであることから、特徴としてGoogleの各サービスと連携できることが挙げられます。例えば、Gmail、Youtube、Googleマップ、Google Workspaceなどです。また、今後も連携されるサービスは増えていく予定で、先の成長が楽しみな生成AIとも言えます。
Claude
Claude(クロード)とは、Anthropic社が開発したチャット型の生成AIです。安全性や倫理観の高さが特徴の生成AIで、有害なコンテンツの生成を抑制した上で、人との自然で安全な対話を目指して開発されています。ブラウザ上で使用できるウェブ版に加えて、iOSとAndroidのアプリにも対応しています。
Anthropic社は、ChatGPTを開発しているOpenAIにいた研究者らによって2021年に設立された会社で、ChatGPTの使用モデルGPT-4の機能を超えたことで有名になりました。
2. 画像生成AI
画像生成AIはプロンプト(テキストでの指示)から画像を生成するAIです。デザインやイラスト制作などの場で活用できます。主な活用シーンは、商品やロゴのデザイン、広告用のイラストやビジュアル制作などです。
DALL·E 3
DALL·E(ダリ)は、ChatGPTと同じ開発元であるOpenAI社によって提供されている画像生成AIサービスです。なかでもDALL·E3はChatGPTと統合され、使い方がとても簡単になりました。
具体的には、ChatGPTの入力エリアに生成したい画像のイメージをテキストで入力し、最後に「画像生成してください。」と入れるだけで、画像を生成してくれます。
ただし、2025年3月現在、無料版のChatGPTだと3枚ほど生成すると、すぐに制限がかかってしまうのと、商用利用が不可であるため、画像生成をがっつり行いたい方や商用利用として使用したい方は、有料プランへの加入がおすすめです。
Stable Diffusion
Stable Diffusionは、オープンソースで公開されている画像生成AIです。簡単にStable Diffusionを使いたい!という場合は、Stable Diffusionが搭載されたオンラインサービスの利用がおすすめです。Stable Diffusionが使えるサービスとしては、
などがあります。プログラミングに強い人は、それぞれ自身のローカル環境にStable Diffusionを構築して自由にカスタマイズすることもできます。生成内容や数に制限がないのがメリットですが、初心者には難しいところがデメリットです。
Adobe Firefly
Adobe Fireflyは、Photoshopやillustratorで有名なAdobe社が提供する、生成AI技術を活用した画像コンテンツの作成機能です。スタンドアロンでブラウザ上で利用することもできますが、PhotoshopやillustratorといったAdobeアプリの中でも利用できるため、Adobeユーザーにおすすめの生成AIです。
また、画像生成のみならず、動画生成と音声生成機能、3Dモデリング生成機能も搭載された多機能ツールです。選択した静止画2つから動画を生成したり、複数の言語で音声を生成したり、立体的なグラフィックの生成も行えます。
また、安全に商用利用できるAIであることも特徴です。Adobe Fireflyを使用して生成したコンテンツが学習に使われることがなかったり、過去に学習した内容は学習に使用する許可が下りたものか、もしくは学習に使用できる権利を有したコンテンツのみが使用されています。画像生成AIを商用利用したい人には安心して使用できるツールです。
3. 音声生成AI
音声生成AIは、音声を入力したり、テキストを入力することによって、新たな音声を生成するAIです。具体的な活用例としては、ナレーションの生成、応答メッセージの作成などが挙げられます。テキストの読み上げに使われたり、特定の人物の声を学習して、その人の音声を合成する技術などがあります。
Amazon Polly
Amazon Pollyは、数十の言語で高品質で自然な人間の声を生成してくれるAI音声ジェネレーターです。深層学習技術を用いており、記事やウェブサイト、PDFやドキュメントなどのテキストの読み上げをおこなってくれます。ひと月あたり数百万文字分の無料利用枠があるので、まずは試しに使ってみたい方にもおすすめです。
発話スタイルや音声の速さ、高さ、大きさなどの調整もできます。また、ほぼリアルタイムで視聴でき、「MP3」「Vorbis」「raw PCM」などさまざまな形式でデータを保存できます。
ElevenLabs
ElevenLabsは、人間のイントネーションを忠実に再現した音声を生成できるAIです。イントネーションや抑揚のコントロールができる音声生成AIなので、より人間らしいリアルな音声を生成できます。
テキストの読み上げや音声テキスト変換(文字起こし)、自分の声をマイク入力して色んな声のサンプルを作成できるボイスチェンジャー、多言語への吹き替え、など多機能な音声生成AIとなっています。無料版だと商用利用不可のため、商用利用で考えている方はStarterプラン以上を申し込んで利用しましょう。
4. 動画生成AI
動画生成AIは、テキストプロンプトや画像、写真を基に、動画を生成できるAIです。SNSの投稿用として画像や静止画に動きをつけたいときや、商品PR用の動画の作成などに活用されています。現段階では、まだあくまで短い時間の動画生成が主で、長時間の動画生成はこれからの可能性に期待です。
Runway ML
Runway MLは、写真や画像を基に、数分で動画に変換できる動画生成AIです。例えば、ポートレート写真に自然な動きを加えたり、ロゴやイラストにアニメーション効果を追加したりといった多種多様な使い方ができます。
無料プランもあり、生成できるクレジット数に制限があったり、高度な編集機能が使えなかったりしますが、まずは試しに使える点がメリットです。また、アカウント登録から動画の生成までブラウザ上で行えて、操作手順も簡単です。長時間の動画は生成できませんが、SNSに簡単な動画を投稿したり、商品PR動画を作成したい方にはおすすめの動画生成AIです。
Pika Labs
Pika Labsは、Runway MLと同じく、画像やテキストから短い動画を生成できるAIツールです。違いで言えば、無料で利用できますが、Discordサーバーへの参加が必要となっています。
また、Pika Labsで生成された動画は、Pika Labs上で簡単な編集も行えます。例えば、動画の長さを延長したり、カメラワークを調整するなど、AIによって生成された素材をベースに、さらにより細かい調整や表現を行うことができます。
5. 3Dモデル生成AI
3Dモデル生成AIは、人工知能の技術で、画像やテキストから3Dモデルを自動生成してくれます。ゲームの開発や映像制作といった分野での活躍が期待されている生成AIです。
Luma AI|GENIE
Luma AIのGENIEは、テキストプロンプトから3Dモデルを生成できるAIです。テキストプロンプトを入力すると、1回の入力で4パターンの3Dモデルを生成してくれます。その中から一番イメージに近いものを選び、そこからさらに細かな調整をすることも可能です。
Luna AIは、3Dモデル生成のGENIEだけでなく、動画生成AIのDream Machineなどいくつかの機能も提供されているので、開発元が同じサービスで、複数の生成AIを使用してみたい人は利用を検討してみると良いかもしれません。無料プランも用意されているので、実際に触ってみると良いでしょう。
Meshy
Meshyは、数百万のユーザーに使用されている3Dモデル生成AIです。テキストプロンプトから3Dモデルを生成することはもちろん、写真や画像を3Dモデルに変換できます。専門知識がなくても簡単に3Dモデルを作成でき、また、作成できるモデルも、リアルなものから漫画チックなもの、彫刻のような質感など、多様なアートスタイルが用意されています。
生成AIは海外の企業が開発していることがほとんどで、日本語ページのないものがほとんどですが、Meshyは多言語のサポートがなされており、Webページ自体も元から日本語ページが用意されているので、利用開始のハードルも高くない点がポイントです。
6. プログラム・コード生成AI
プログラム・コード生成AIは、プログラマーのコーディング作業を支援してくれる生成AIです。実際に業務としてプログラミングに従事しているユーザーはもちろん、プログラミングを学習している人にとっても便利な生成AIとなっています。
GitHub Copilot
GitHub Copilotは、AIコーディングアシスタントと呼ばれており、プログラマのコーディング作業を支援するサービスです。GitHub Copilotが対応しているプログラミング言語は様々で、Python、JavaScript、TypeScript、Ruby、Go、C#、C++などを得意としています。
ユーザーが入力したコードやプロンプトをもとに、GitHub Copilotが最適なコードを提案してくれます。リアルタイムでコードを補完してくれるため、コーディング作業を大幅に効率化できるようになりました。ただし、提案されるコードは常に絶対的に正しいわけではないため、必ずコードレビューは行うようにしましょう。
Amazon CodeWhisperer
Amazon CodeWhispererは、ソフトウェア開発のための有能なコードアシスタントとしての生成AIであり、AWS(Amazon Web Service)ユーザーにおすすめのツールです。GitHub Copilotも同様ですが、コードエディタ内でプラグイン、もしくは拡張機能として利用できるコード支援サービスです。
コメントや既存のコードに基づいて、スニペットから完全な関数まで、リアルタイムでコードを提案してくれます。コードを最適化してくれるのはもちろん、コードをスキャンして脆弱性がないかどうかを確認してくれて、作成したコードの信頼性を高めて、セキュリティを強化してくれます。
7. 音楽生成AI
音楽生成AIは、膨大な音楽データから曲のパターンや特徴を学習して、新しい音楽を作り出す生成AIです。学習したデータを基に自動的に新しい音楽を生み出すものと、既存の音楽をアレンジしたり、コンポーザーのアイデア出しをサポートしてくれるサポート型の音楽生成AIと、大きく2種類の音楽生成AIが存在しています。作成した音源が商用利用できるか、著作権に引っかからないか、しっかり確認しながら利用するようにしましょう。
AIVA
AIVAは、音楽ジャンルを選んだり、コード進行を選んで、そこからBGMを生成することができます。よりカスタマイズ性の高いBGMを生成したい場合には、生成したコード進行を基にして、そこからメロディ、ベースライン、パーカッションを生成して、それらを合わせて1つの楽曲にすることもできます。
また、上記の使い方以外にも、音楽ファイルをアップロードして、それを基に新しい音楽を生成してくれる機能があります。しかし、アップロードした音楽データは、AIVAの学習に利用されるため、この機能を使用する場合は、権利侵害に当たらないかを確認した上で利用するようにしましょう。
利用するプランによって、生成した曲の著作権が利用者側にあるのか、AIVA側にあるのか、商用利用できるのかできないのか、などが異なるため、利用する際はプラン内容をしっかり確認して目的に応じて利用プランを選びましょう。
Soundraw
Soundrawは、ジャンルミックス機能が特徴の音楽生成AIです。ジャンルミックス機能とは、2つのジャンルをミックスして新たな音楽を生成できる機能です。ジャンルの垣根を超えた音楽が生成できます。曲の長さやサビの位置、楽器の種類などカスタマイズしながら曲を編集をすることもできます。
Soundrawで生成される音楽は、開発元の社内でオリジナルビートを作成して、それを基にAI学習したものであるため、商用利用の安全性が保証されています。コンテンツ制作のクリエイター向けのプランと、楽曲制作用のアーティスト向けプランの2つが用意されていますので、使用用途に応じてプランを選択しましょう。
生成AIを活用するメリット
生成AIを活用する大きなメリットとしては、業務効率アップや作業時間の削減できることが挙げられます。文章を作成する、文章を添削する、コードを生成する、といったような単純な作業時間が大幅に削減できることによって、他の作業に注力したり、リソースを割けるようになる点がメリットのひとつです。
また、新しいアイデアの創出という点で、画像生成AIや音楽生成AIなどを利用することで、生成AIと人間の新たな合作といったクリエイティブの幅が広がっていく可能性が広がっています。
その反面、生成AIの生成物の著作権はどこに帰属されるのか、もしくは、学習元のデータ自体が著作権に抵触していないか、AIから生成された情報に誤情報がないか確認することなど、利用者ひとりひとりがAIリテラシーを持つことが重要です。
生成AIを活用する上でのメリット・デメリットについて、より詳しく知りたい方は、下記参考記事もご覧ください。
生成AIを使用する際の3つの注意点
1. 情報の正確性を確認することと品質管理を徹底する
生成AIが出力してくれた結果を100%信用するのは危険です。というのも、生成AIは大量の言語データを学習して、統計的な推測で文章を生成しているので、ハルシネーション(誤情報)を生む可能性があるためです。生成された情報が正しいのかどうか、最終的なチェックは必ず人の目で行うようにしましょう。
また、品質管理の側面として、AIの生成結果を定期的に評価する仕組みを整えておくことも重要です。フィードバックを繰り返すことで、継続的に改善し続けていき、品質基準を保ちながら、長期的に生成AIを活用していくことができます。
2. データのセキュリティとプライバシーに配慮する
個人情報や社内外の業務に関する機密情報を扱うような場合は、セキュリティ対策を万全にしましょう。また、使用するツールで行われているセキュリティ対策を、ツールの導入前にきちんと確認するようにしましょう。
生成AIの利用には、情報漏洩リスクがあります。また、入力したデータが再学習に使用される可能性もあります。再学習に利用されたくない場合は、使用しない設定があるのか、など利用規約を必ず確認するようにしましょう。
3. 法規制や倫理面に配慮する
生成AIはプロンプトを入力するだけで、画像や動画、音楽を生成してくれる点は大変便利ですが、AIが生成したコンテンツの著作権には不明確な部分が存在しています。どんなデータを学習しているのか、学習に使われたデータによっては、既存のものと類似したものを生成する可能性があります。
また、生成AIが作成した文章や画像、動画、音楽などを商用利用する場合にも、著作権を侵害していないか、リスクや生成AIごとのガイドラインや利用規約を確認するようにしましょう。また、AIが生成したものは、そのまま使用するのではなく、人の手で修正や編集などの手を加えるようにしましょう。
さらに、生成AIに関する法規制は国によっても違いがあります。現在進行形で各国で整備が進んでいるところのため、常に最新の情報をチェックして、AIの活用が規制に違反しないように注意して利用するようにしましょう。
まとめ|多様なコンテンツを作成できる生成AIを活用していこう!
本記事では、生成AIの種類として、
- テキスト生成AI
- 画像生成AI
- 音声生成AI
- 動画生成AI
- 3Dモデル生成AI
- プログラム・コード生成AI
- 音楽生成AI
の上記それぞれの生成AIサービスをご紹介しました。多種多様なコンテンツを自動生成できる生成AIは、日頃繰り返し行っているような単純なタスクを効率化してくれたり、または、新しいコンテンツを創造してくれたり、活用の幅はどんどん広がってきています。
万能なツールに思える生成AIですが、その一方で、著作権や倫理的な問題であったり、ハルシネーションの拡散リスクとは常に隣り合わせです。まだまだ発展途上であり、今後も大きく進化を遂げていくであろう生成AIについて、正しく理解して、リテラシー能力を高めていくことが重要です。生成AIについて理解を含めて、新たなコンテンツを生み出していくパートナーとして、適切に効果的に活用していきましょう。
- 会議後のまとめ作業に時間がかかっている
- 会議中のメモが大変で追いつかない
- 議事録作成後の言った言わない問題の確認が大変
このような議事録に関するお悩みがあれば、ぜひ一度AI議事録サービス「スマート書記」をお試しください。
スマート書記は議事録などのドキュメント作成に関する作業を自動化・効率化することができ、作成時間を最大90%以上削減することが可能です。