ここ最近もAIの進化を大きく感じる週でした。中国では「Manus」というAIエージェントを搭載したサービスの情報が出てきており、実際にさまざまなタスクが自動化される未来が想像できます。いよいよ本格的に普及が進んでいくのではないかと感じましたね。社会実装に関しては一気に広がることはないかもしれませんが、少しずつ浸透していくのではないでしょうか。
ここでは、ゲーム制作や日常的に活用できそうな話題について取り上げていくので、興味があればぜひご覧ください。
特にGoogleのAIが大きく進展しましたね。ここ最近は、他のAIと比べて遅れを取っている印象でしたが、少しずつ追いついてきそうな雰囲気が出てきました。
1. Google Deep Researchが無料化
-
包括的なリサーチ: 複雑なトピックに関する調査を自動で行い、詳細なレポートを生成。
-
マルチステップの調査プラン: ユーザーの要求に基づいて、段階的に情報を収集し、整理する機能。
-
無料での利用: 現在、すべてのGeminiユーザーが制限付きで無料で利用可能。
-
多言語対応: 45以上の言語で利用でき、グローバルなユーザーに対応。
-
パーソナライズ機能: ユーザーの過去の検索履歴を基に、より関連性の高い情報を提供
個人的なメモ
OpenAIのDeep Researchも使ったことがありますが、今では他のAIサービスにも普通に実装されるようになりましたね。技術の進化があまりに速すぎて驚きます。
ゲーム開発で活用するなら、市場調査や競合分析あたりが主な用途になると思います。ただ、趣味レベルでは使う機会が少ないかもしれません。しかし、リサーチ業務を行う機会があれば、積極的に活用したいですね。
2. Gemini2.0 Flash(Image Generation)Experimental
-
思考プロセスの可視化: ユーザーがAIの推論過程を確認できる機能を持ち、透明性が高い。
-
強化された推論能力: 従来のモデルよりも複雑な問題を効率的に解決する能力が向上。
-
マルチモーダル入力: テキスト、画像、音声、動画など、さまざまなデータを同時に処理可能。
-
自己レビュー機能: 結果を発表する前に自己チェックを行い、エラーや幻覚を最小限に抑える。
-
高速処理: 前世代のモデルに比べて処理速度が向上しており、リアルタイムでの応答が可能
個人的なメモ
今週の発表の中で、最も大きなニュースだったと思います。特に、入力した画像のコンテキストをしっかり読み取る能力が向上している点が非常に大きいですね。
これまでのAIによる画像生成の課題として、世界観をうまくくみ取るのが難しいという点がありました。しかし、最新のモデルでは、元の画像の表現に近い形で出力できるため、ゲーム制作への活用も期待できそうです。特に、一枚の絵から派生して新たな画像を作成できる点が魅力的だと思いました。
以下は、横向きの画像を正面向きに変更した例です。
現在、Gemini内のサイトでは利用できませんが、以下のリンクにある Google AI Studio では使用可能です。興味があれば試してみるといいですね。
Google AI Studio
まとめ
GoogleのAIの進化により、個人的に苦手なイラスト制作やビジュアル面での作業において、大きな助けとなる一歩だと感じました。Googleはマルチモーダル技術に力を入れており、音声やイラストなど、幅広い出力形式で他の企業との差別化を図ろうとしているのがよく分かります。
これまでOpenAIのサービスを中心に利用していましたが、流れが大きく変わりつつありますね。Claudeはプログラミング関連での活用が主流になりつつあり、それぞれのAIの用途が明確に分かれてきた印象です。このあたりの使い分けを意識すると、より効率的に活用できそうですね。