Googleの生成AI「Gemini」がいろいろアップグレードしています、Google Colaboratoryからの利用も可能でした

2024.03.222025.06.17

この記事は約7分で読めます。

Googleの生成AI「Gemini」が大幅に拡張しているようです。「Gemini Pro」も「Gemini Ultra」も2.0になっています。
これまで「Gemini」についてはWEBの画面でのチャット形式でしか利用していませんでした。（WEB画面で利用しているのはGemini Proで無料です）この、「Gemini Pro」をWEB上でGPUコンピュータサービスを利用できる「Google Colaboratory」からAPI呼び出しして利用するという使い方が無料でできるようです。

このページの目次

Googleの生成AI「Gemini」をAPIで使う方法

Googleの生成AI「Gemini」をAPIで使う方法

スタートする手順をChatGPTに聞いてみました

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順について、どうすればいいか？ということをChatGPTで調べてみました。正確ではないかもしれませんが、一般的にGoogleのAIモデルをColaboratoryで使用するには、以下のステップを踏むことが想定されるようです。

Google AI Studioへのアクセスまたは登録: Gemini 1.5を使用するには、Google AI Studioへのアクセスが必要です。Google AI StudioでGeminiモデルへのアクセスを申請し、利用開始の承認を得る必要があります。
APIキーの取得: Google AI StudioでGemini 1.5にアクセスするためのAPIキーを取得します。このAPIキーは、ColaboratoryのノートブックからGemini 1.5モデルを呼び出す際に必要になります。
Google Colaboratoryのノートブックの準備: Colaboratoryで新しいノートブックを作成し、必要なライブラリをインポートします。Gemini 1.5を使用するためには、Google Cloudのライブラリやその他の関連ライブラリが必要になる場合があります。
APIキーの設定: ノートブック内でAPIキーを設定し、認証を行います。これにより、GoogleのAPIを安全に使用するための認証が行われます。
Gemini 1.5モデルの呼び出し: APIキーを使用してGemini 1.5モデルを呼び出し、必要なパラメータを指定してAIモデルからの応答を受け取ります。これには、テキスト、画像、ビデオなどのデータをモデルに送信し、生成された応答を取得するコードが含まれます。

Google AI StudioやGoogle Colaboratoryの公式ドキュメント、またはGoogleから提供されるGemini 1.5に関する最新のガイドやチュートリアルを参照してください。これにより、最新の情報と具体的な手順を確認することができます。

直接的な情報が不足しているため、上記のステップは一般的なガイドラインということですが、これでおおまかなステップがわかりました。

GeminiにもGemini 1.5をGoogle Colaboratoryで使う方法を聞いてみました

Geminiの使い方は、Geminiに聞いてみましょう。

どもども遠田

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順をおしえてください

AIの回答

Gemini 1.5をGoogle Colaboratoryで始めるための具体的な方法や手順

必要なもの

Googleアカウント
Google Colaboratory
TPU (推奨)

手順

Google Colaboratoryにアクセスします。
新しいノートブックを作成します。
次のコードをノートブックに貼り付けます。

!pip install -q -U git+https://github.com/google/Gemini.git

コードを実行します。
次のコードを貼り付けます。

from gemini import Gemini

model = Gemini(model_id="1.5")

# テキスト生成
text = model.generate("こんにちは、世界！")
print(text)

# 翻訳
translated_text = model.translate("こんにちは、世界！", "en", "ja")
print(translated_text)

# 質問応答
answer = model.answer("日本の首都は？")
print(answer)

コードを実行します。

詳細

Gemini 1.5は、Google AIが開発したLLMです。
テキスト生成、翻訳、質問応答など、様々なタスクを実行できます。
Google Colaboratoryは、ブラウザ上でPythonコードを実行できるサービスです。
TPUは、Google Cloud Platformが提供するAIアクセラレータです。
TPUを使用すると、Gemini 1.5をより高速に実行できます。

参考資料

Gemini GitHubリポジトリ: [無効な URL を削除しました]
Google Colaboratoryドキュメント: https://colab.research.google.com/notebooks/intro.ipynb
TPUドキュメント: https://cloud.google.com/tpu/

注意事項