Skip to content
Copied!
published on 2026-04-11

1. 概要

米Googleは2026年1月15日,オープンソースの翻訳モデル「TranslateGemma」を発表しました。本モデルはGemma 3を基盤として構築されており,55言語間の翻訳に対応しています。従来の翻訳モデル群と比較して,ローカルデバイス上での処理においても高精度な翻訳が可能である点が特徴とされています。

筆者はローカル環境での大規模言語モデル運用のためにOllamaを使用しています。Ollamaは,大規模言語モデル(Large Language Model, LLM)をローカル環境で容易に実行・管理するためのツールおよび実行基盤であり,コマンド一つでモデルの取得,起動,推論を行えるよう設計されています。量子化済みモデルを利用することで,大規模GPUを備えない一般的なPCでも実用的な推論を実行できる点が特徴です。環境構築の負担を抑えつつ,プライバシー保護やオフライン運用を重視したLLM利用を実現できるため,研究者やエンジニアにとって有用な選択肢となっています。また,筆者はフロントエンドにはOpen WebUIを使用しており,ブラウザ上のチャットUIを通じてLLMにアクセスできる構成としています。本環境ではモデルを切り替えながら対話形式で利用でき,OllamaやOpenAI互換APIなどのバックエンドと接続して動作します。

手元の実行環境は16-inch MacBook Pro(M2 Max,ユニファイドメモリ64 GB)です。Apple Silicon MacではCPUとGPUがメモリを共有するユニファイドメモリアーキテクチャが採用されており,おおよそ10 GB程度がCPU側で使用され,残りはGPU用途に割り当て可能です。このため64 GB構成であれば48〜54 GB程度をGPU計算に利用できます。一般的なIntel/AMD系PCにおいて48 GB級のGPUメモリを用意することは容易ではありません。筆者はAMD Ryzen 9 9950X3DとNVIDIA GeForce RTX 5080を搭載したゲーミングPCも所有していますが,こちらはシステム全体の価格が高いにもかかわらずGPUメモリは16 GBにとどまり,ローカルLLM用途では必ずしも有利とは言えません。

2025年を通して生成AIの性能は大きく向上したと感じられます。一般公開初期のChatGPT 3.5はハルシネーションが多く,もっともらしい口調で誤情報を生成する傾向が強かったため,実用性よりもエンターテインメント性が際立っていました。現在,筆者はクラウド型AIとして主にAnthropic Claude,OpenAI ChatGPTおよびGitHub Copilotを使用していますが,以前と比較して信頼して利用できる場面が大きく増えたと感じています。

一方で,2025年末から2026年初頭にかけて,オンプレミス環境での生成AIも実用的な水準に到達してきました。蒸留や量子化などの技術により,より小規模なモデルで従来と同等の性能を実現できるようになってきたことが背景にあると考えられます。実際,ひとつ前の世代の半分程度のパラメータ数で同等性能を示すモデルも見られます。ただし,小型モデルでは依然としてハルシネーションが多く,初期のLLMを思わせる挙動も見られます。対象とするデータを限定した用途ではハルシネーションを抑えやすい印象があり,特に外部に送信したくない情報を扱う場合にはオンプレミスAIが適しています。一方で,Web検索を伴う利用や広範な知識を必要とする問いにはクラウドAIの方が適しており,用途に応じた使い分けが必要です。

翻訳は,外部に出したくないテキストを扱うことが多く,かつ対象文書のみで完結するタスクであるため,オンプレミスAIに適した用途と言えます。そこでTranslateGemmaを試用しました。本モデルには複数のパラメータサイズが用意されていますが,本稿では12Bモデルを使用しています。翻訳品質は概ね良好であり,ローカル実行でも実用的な性能が得られました。ただし,TranslateGemmaは規定されたプロンプトを厳密に使用する必要があり,翻訳のたびにOpen WebUIへプロンプトと対象テキストを貼り付ける操作は煩雑です。

この手間を軽減するため,Bashスクリプトを作成し,Alfredのショートカットから呼び出せるようにしました。テキストが選択されている場合は選択範囲を対象とし,選択がない場合はクリップボードの内容を翻訳します。日本語は英語へ,英語は日本語へ自動判定して翻訳するようにしており,ローカル環境で即座に翻訳できるため,非常に快適に利用できます。

本稿では,TranslateGemmaを用いた翻訳スクリプトの実装方法を紹介するとともに,AlfredのWorkflow機能を利用して,ショートカットまたはキーワード操作により選択テキストを即座に翻訳できる環境を構築する手順について説明します。