AI(人工知能/ディープラーニング)

Googleの生成AI「Gemini」がいろいろアップグレードしています、Google Colaboratoryからの利用も可能でした

この記事は約7分で読めます。

Googleの生成AI「Gemini」Googleの生成AI「Gemini」が大幅に拡張しているようです。「Gemini Pro」も「Gemini Ultra」も2.0になっています。
これまで「Gemini」についてはWEBの画面でのチャット形式でしか利用していませんでした。(WEB画面で利用しているのはGemini Proで無料です)この、「Gemini Pro」をWEB上でGPUコンピュータサービスを利用できる「Google Colaboratory」からAPI呼び出しして利用するという使い方が無料でできるようです。

Googleの生成AI「Gemini」をAPIで使う方法

スタートする手順をChatGPTに聞いてみました

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順について、どうすればいいか?ということをChatGPTで調べてみました。正確ではないかもしれませんが、一般的にGoogleのAIモデルをColaboratoryで使用するには、以下のステップを踏むことが想定されるようです。

  1. Google AI Studioへのアクセスまたは登録: Gemini 1.5を使用するには、Google AI Studioへのアクセスが必要です。Google AI StudioでGeminiモデルへのアクセスを申請し、利用開始の承認を得る必要があります。
  2. APIキーの取得: Google AI StudioでGemini 1.5にアクセスするためのAPIキーを取得します。このAPIキーは、ColaboratoryのノートブックからGemini 1.5モデルを呼び出す際に必要になります。
  3. Google Colaboratoryのノートブックの準備: Colaboratoryで新しいノートブックを作成し、必要なライブラリをインポートします。Gemini 1.5を使用するためには、Google Cloudのライブラリやその他の関連ライブラリが必要になる場合があります。
  4. APIキーの設定: ノートブック内でAPIキーを設定し、認証を行います。これにより、GoogleのAPIを安全に使用するための認証が行われます。
  5. Gemini 1.5モデルの呼び出し: APIキーを使用してGemini 1.5モデルを呼び出し、必要なパラメータを指定してAIモデルからの応答を受け取ります。これには、テキスト、画像、ビデオなどのデータをモデルに送信し、生成された応答を取得するコードが含まれます。

Google AI StudioやGoogle Colaboratoryの公式ドキュメント、またはGoogleから提供されるGemini 1.5に関する最新のガイドやチュートリアルを参照してください。これにより、最新の情報と具体的な手順を確認することができます。

直接的な情報が不足しているため、上記のステップは一般的なガイドラインということですが、これでおおまかなステップがわかりました。

GeminiにもGemini 1.5をGoogle Colaboratoryで使う方法を聞いてみました

Geminiの使い方は、Geminiに聞いてみましょう。

どもども遠田
どもども遠田

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順をおしえてください

AIの回答
AIの回答

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順

必要なもの

  • Googleアカウント
  • Google Colaboratory
  • TPU (推奨)

手順

  1. Google Colaboratoryにアクセスします。
  2. 新しいノートブックを作成します。
  3. 次のコードをノートブックに貼り付けます。
!pip install -q -U git+https://github.com/google/Gemini.git
  1. コードを実行します。
  2. 次のコードを貼り付けます。
from gemini import Gemini

model = Gemini(model_id="1.5")

# テキスト生成
text = model.generate("こんにちは、世界!")
print(text)

# 翻訳
translated_text = model.translate("こんにちは、世界!", "en", "ja")
print(translated_text)

# 質問応答
answer = model.answer("日本の首都は?")
print(answer)
  1. コードを実行します。

詳細

  • Gemini 1.5は、Google AIが開発したLLMです。
  • テキスト生成、翻訳、質問応答など、様々なタスクを実行できます。
  • Google Colaboratoryは、ブラウザ上でPythonコードを実行できるサービスです。
  • TPUは、Google Cloud Platformが提供するAIアクセラレータです。
  • TPUを使用すると、Gemini 1.5をより高速に実行できます。

参考資料

注意事項

  • Gemini 1.5は、まだ開発中のモデルです。
  • 生成されるテキストは、必ずしも正確とは限りません。
  • TPUを使用するには、Google Cloud Platformのアカウントが必要です。

その他

  • Gemini 1.5は、様々な方法で利用できます。
  • 詳細については、Gemini GitHubリポジトリのREADMEを参照してください。

日本語版

この文書は、Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順を日本語で説明しています。

なるほど。さすが本家本元のところに聞くと具体的な回答ができてきますね。

では、Google AI Studioに登録しましょう

Google AI for Developers | Build with the Google Gemini API and Gemma open models  |  Google for Developers
Integrate the Gemini API using Gemini 1.5 Flash and 1.5 Pro to transform ideas into AI apps.

Geminiモデルへのアクセスを申請し、利用開始の承認を得る必要があります。APIキーを発行してもらいます。

選択肢が2つ示されました。
上が「Google AI Stujio」です。一般的には上を選択するのでしょうが、今回はGoogleColaboratoryに接続して利用したかったので、下の「Develop in your own environment」を選択しました。

API Keysを作る画面にきました。ここでも選択肢が示されました。

GoogleCloudProjectで使うことになるらしいので、そちらを選択すると、さらに自分の「Google Colaboratory」の名前が表示されます。いくつか表示された中で、使いたいやつを選び「API Keys」を発行します。

「API Keys」を発行したので記録しておきました。

さて、そのままの画面で「Chat」というのがあったので、試しに動くのかどうかを知るうえでも質問してみました。するとちゃんと回答が返ってきました。

このままでも使える状況になったようですね。

Vertex AI Studioを使ってみる

GoogleのAIサービスの構造が複雑なので、調べてみるといろんな入口があり、よくわからないですね。

「Vertex AI Studio」という画面でもGeminiが利用できるみたいです。

Vertex AI Studio
大規模な AI モデルを簡単に操作、調整、デプロイして、ジェネレーティブ AI の本番環境への移行を加速します。

「今すぐ試す」をクリックすると使えそうな画面に推移しました。しかし実際に使おうとすると、課金対象のための承認が必要な画面になったため、そこで中断しました。

「Google Colaboratory」はGoogleDriveから

Google Colaboratoryを使うのは5年ぶりです。ずいぶん進化しているはずなので使いかも変わっていそうです。

Google Driveを開いて「ColabNotebooks」からノートを作成するところからですね。

なんだか懐かしいファイルがいっぱい有りました。

既存ファイルをコピーして新規で作成しています。

すっかり使い方を忘れており作業を中断しました。

右側にオンラインヘルプがあり、それがAI生成なので便利だなと思いました。今日の成果はそれぐらいでした(笑)

自分にはChat型のほうが適しているようです。