.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

OSS(オープンソース)のLLMは、ローカルマシンやオンプレミス環境で動作可能なものが多く、
クラウドサービスに依存せずに利用でき、機密情報を扱うクローズドな環境でも安全に導入できる。

詳細

注意点

ライセンスの確認

OSSのライセンス

コミュニティの活発度

コミュニティの活動状況を確認。

ベンチマークと評価

性能とスケーラビリティ

ハルシネーション・バイアスなど

メンテナンスとサポート

OSS LLMのメンテナンス体制とサポート体制を確認。

カスタマイズの容易さ

データ保護

モデルのトレーニングや推論に使用するデータの保護を確認。

モデル

Llama

Gemma

Phi-3

Mixtral

Falcon

アブダビのTechnology Innovation Institute(TII)によって開発

BLOOM

BigScience?という協力的AI研究ワークショップによって開発

EleutherAI

草の根の非営利の人工知能研究グループによって開発

Qwen2

CodeGen?

Salesforceが提供するLLM

Databricks

AI/BI系のプラットフォームベンダで、色々なOSSをホストしている。

フォーマット

GGML、GGUF、GPTQは、主にLLMの軽量化・実行する際の 形式・技術・ツール

項目GGMLGGUFGPTQ
種類実行ライブラリモデルフォーマット量子化技術・ツール
主な用途軽量モデルの実行モデル配布・互換性統一モデルの圧縮(量子化)
関連技術llama.cppllama.cpp, koboldcpp などExLlama?, AutoGPTQ など
主な形式.bin(旧).gguf(新).safetensors, .bin

GGML

(Georgi Gerganov's ML Library)

GGUF

(GGML Universal Format)

GPTQ

(GPT Quantization)

項目旧形式Hugging Face形式
ファイル形式PyTorchバイナリ(.bin)HF標準(.safetensors, .json, .model)
互換性限定的(専用コード必要)AutoGPTQ, transformers 互換
配布zipやgitで配布Hugging Face Hubで共有
安全性・速度通常の.binは非検証.safetensorsで検証&高速
推奨度過去の形式、現在は非推奨標準化されており現在の主流・推奨

検環環境

VM費用見積もり

稼働時間

5(営業日/週) * 4(週/月)* 3(時間/日)= 60(時間/月)で見積もり

※ 1か月フル稼働は730時間なので30/730=0.04ヵ月分(つまり、以下の「/月」は、=0.04ヵ月分)

VMサイズ

付帯費用

Azureバッション2万/月など

実費総額

コレはミニマム環境なので、予算としては、5万/月ほどあると良さそう。

参考

Ollama

Notebook

VM費用見積もり


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS