OSSのLLM のバックアップ(No.42)

WSL2からDockerを起動するには...
- The command 'docker' could not be found in this WSL 2 distro. #Docker - Qiita
  https://qiita.com/chovin/items/3057b35b776f70c3bcb5

WSL2からDockerでOpen WebUIを起動して、

docker run -d -p 5955:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

↑

動作確認 †

以下のURLにアクセスすると（何故か）WLS2上のOllamaにアクセスできる。
```
http://127.0.0.1:5955/
```

設定を確認すると、モデルは以下のように設定されており、
コンテナからホスト上のサービスにアクセスしているらしい。
```
http://host.docker.internal:11434
```

↑

Streamlit †

StreamlitはPythonアプリ（CLI）を迅速にWeb化するツール。
標準I/Oへ書き込むのではなくAPIを使用して専用のStreamへの書き込む。

↑

インストール †

インストールして
```
pip install streamlit
```

↑

動作確認 †

実行する。
```
streamlit run LLM_Streamlit.py
```

UIにアクセスする。
```
http://localhost:8501/
```

↑

稼働時間 †

5（営業日/週） * 4（週/月）* 3（時間/日）＝ 60（時間/月）で見積もり

※ 1か月フル稼働は730時間なので30/730=0.04ヵ月分（つまり、以下の「/月」は、=0.04ヵ月分）

↑

VMサイズ †

LLaMA 3 1B、Phi-3はノートPCでも動作する。

LLaMA 3 8Bに必要なVMサイズは、
- AWSでg4dn.xlarge、AzureでNC4as_T4_v3辺りで、
- NC4as_T4_v3 - NC16as_T4_v3辺りで見積もると、0.5-1万/月程度、
- これは一か月上げっぱなすと10-20万

小さなモデルをファインチューニングをする場合、
- 24GBほどのVRAMが必要で、
- AzureでNC6s_v3や、NC24ads_A100_v4位のスペックが必要。
- NC6s_v3だと2万、NC24ads_A100_v4だと2.5万/月（これも行けそう）
- これは一か月上げっぱなすと50-60万

LLaMA 3 70Bを稼働させる場合、
- AWSでg5.xlarge、AzureでND96asr_A100_v4辺り
- ND96asr_A100_v4だと10万/月（無理（笑））
- これは一か月上げっぱなすと250万
- A100は1枚で$11,000（約163万円）

↑

付帯費用 †

Azureバッション2万/月

↑

実費総額 †

コレはミニマム環境なので、予算としては、5万/月ほどあると良さそう。

↑

研究 †

↑

ローカルRAG †

LlamaIndexを使うか、NoSQLの機能を使用する（古くはElasticsearchなどあるが、ベクトル検索、グラフ検索に対応した新しいものが出てきている）。

↑

ファイン・チューニング? †

LLMの新規作成時にタスクへ適応させるためのFT（GPT-n、BERT）ではなく、作成後のLLMの精度を上げるために行われるFTについて言及

↑

参考 †

深層学習についてのレポート（LLM編）
https://www.osscons.jp/joho108j0-537/#_537

DxCommon?/Notebook/Jupyter/path at master · OpenTouryoProject?/DxCommon?
https://github.com/OpenTouryoProject/DxCommon/tree/master/Notebook/Jupyter/path
- LLM_Ollama.ipynb
- LLM_Streamlit.py
- ,etc.

LLMの実行方法と周辺ツールまとめ #OpenAI
https://qiita.com/simakihiro/items/7467b849212fb3863e3b

LLM Tools - Ranking | OSS Insight
https://ossinsight.io/collections/llm-tools/

↑

Ollama †

【Ollama】自宅サーバーでかんたんにローカルLLMを動かす方法*
https://zenn.dev/fp16/articles/e8c61e2f62e6b6
LLaMa?-3をAPIサーバーのように使う方法 #LLM
https://qiita.com/tasuku-revol/items/6a287fb69ce4a423dbe0

↑

Ubuntu †

第825回　ローカルLLMの実行ツールであるOllamaをUbuntuで動かす | gihyo.jp
https://gihyo.jp/admin/serial/01/ubuntu-recipe/0825

＋Docker

Llama3の環境構築からCUIでの実行まで #Docker
https://qiita.com/masa3000/items/8ed69d2036255e5f0af2

↑

Windows †

10分の作業で利用可能。WindowsPCで簡単に
生成AI（LLM）が動くようになっていたので紹介 #ollama
https://qiita.com/kit/items/cd3a7f8116982d61c06d

WindowsでOllamaを使って、ローカルで動くLLMのLlama3やPhi3を使いこなす！
https://zenn.dev/shohei6117/scraps/0b07661a5e670e

＋WSL2

WSLでローカルLLMを動かす #ollama - Qiita
https://qiita.com/thistle0420/items/b095d169404806002b55

WSL2を使ってAI用の環境を構築（Ollama試行利用編）
https://enrock2023-itblogger.com/ollama-review/

初心者がとりあえずローカルLLMを触ってみる（Windows10×WSL2×Llama-3-ELYZA-JP-8B） #生成AI - Qiita
https://qiita.com/yoku8983/items/9ddbe1b30182d672c9ac

【WSL2】WSL2側からホストのlocalhostで立っているAPIサーバーのAPIをcURLで叩く方法 #WSL - Qiita
https://qiita.com/b_tanukiudon_rk/items/416cd1547fb4504972d3

＋Docker

WSL2とDockerでWindows上にOllamaを構築する
https://zenn.dev/toki_mwc/articles/d1ebbd634ff488

Windows の WSL2 で入れた Ubuntu で Docker + Ollama + llama3 を動かしたメモ – 1ft-seabass.jp.MEMO
https://www.1ft-seabass.jp/memo/2024/05/26/windows-wsl2-ubuntu-docker-ollama-llama3/

ollama (llama3) + docker + wsl2 + ubuntu24メモ #Docker - Qiita
https://qiita.com/kiyotaman/items/cf405a654cee1f21641f

プロダクションでOllamaを使う場合のインストールメモ #LLM - Qiita
https://qiita.com/kiyotaman/items/1aeb098b5ff0d6d5e641

↑

LLM †

Llama、Gemma、phiなどがある。

【ollama / Phi-3】ニュースで話題のLLMをローカルPC上で動かしてみる
https://zenn.dev/tanny/articles/705682d88e254e

Phi-3をOllamaを使ってローカルで動作させる #AI - Qiita
https://qiita.com/ishidahra01/items/16e560105137d41a79f0

↑

Python Library †

↑

Ollama †

【ローカルLLM】Ollama Python Libraryのメソッド一覧と動作例 #DeepLearning? - Qiita
https://qiita.com/LiberalArts/items/6492e54d479789eddbcd

↑

OpenAI †

↑

フレームワーク †

↑

LangChain †

↑

LlamaIndex †

↑

AutoGen †

↑

UI †

↑

Open WebUI †

Ollamaをwslにインストールして使う。ついでにwebブラウザでOllamaを表示させる #WSL - Qiita
https://qiita.com/mkuwan/items/ff84679ed8308ae78979

↑

Ollama-ui †

Windows版 Ollama と Ollama-ui を使ってPhi3-mini を試してみた #Windows,Ollama,Ollama-ui - Qiita
https://qiita.com/programing_diy_kanrinin/items/24d0778a42ae0f24deae

↑

Streamlit †

streamlitを使ったお手軽Webアプリ開発 #Python - Qiita
https://qiita.com/sypn/items/80962d84126be4092d3c

Streamlit入門＋応用～データ分析Webアプリを爆速で開発する #Python - Qiita
https://qiita.com/tamura__246/items/366b5581c03dd74f4508

↑

ローコード †

↑

LangFlow †

↑

FlowiseAI †

↑

Dify †

プロキシ環境下のローカルPCに"Dify"と"Ollama"を導入して、
インターネットを通らない「完全ローカルRAGアプリ」を作る #生成AI - Qiita
https://qiita.com/yuki_ink/items/c3125f45fb725612910e

↑

... †

↑

ファイン・チューニング †

Google Colab で Llama 3 のファインチューニングを試す｜npaka
https://note.com/npaka/n/n315c0bdbbf00

日本語LLMのファインチューニング入門 – 自作・Hugging Face公開データセット対応 | 子供プログラマー
https://child-programmer.com/llm-ft-tutorial/

MetaのオープンソースLLM「Llama 3」を日本語版にファインチューニング（SFT） #生成AI - Qiita
https://qiita.com/bostonchou/items/bf4a34dcbaf45828f886

↑

LoRA †

LoRAによるSLMのファインチューニングのハイパーパラメータチューニング - target_modules
https://zenn.dev/headwaters/articles/123f4b68e07ea6

LoRA(ローラ)とは｜今年注目の画像生成AI (Stable Diffusion) のファインチューニングを試してみた | Ledge.ai
https://ledge.ai/articles/LoRA

↑

VM費用見積もり †

AzureのGPU搭載VMを安い順に並べる（2023年9月版）｜saip(さいぴ)
https://note.com/sa1p/n/n0485cd0d8a04

AWS：g4dn.xlarge、Azure：NC4as_T4_v3 （￥91/時）
- 【UiPath?】AWS/Azure仮想マシンでローカルLLM環境を構築する #ollama - Qiita
  https://qiita.com/hidecha/items/dba9e863d3651989bfc3

ColabのGPU → A100は、AzureのNC_A100_v4シリーズ、NC24ads_A100_v4相当（￥682/時）
- Llama-3をColabで記事執筆用にファインチューニングしてみた
  https://zenn.dev/carenet/articles/0d2e1100121b0e

LLaMA 3を本番環境に導入するには？
https://nlpcloud.com/ja/how-to-install-and-deploy-llama-3-into-production.html

料金計算ツール | Microsoft Azure
https://azure.microsoft.com/ja-jp/pricing/calculator/

目次 †

概要 †

詳細 †

注意点 †

ライセンスの確認 †

コミュニティの活発度 †

ベンチマークと評価 †

性能とスケーラビリティ †

ハルシネーション・バイアスなど †

メンテナンスとサポート †

カスタマイズの容易さ †

データ保護 †

モデル †

Llama †

Gemma †

Phi-3 †

Mixtral †

Falcon †

BLOOM †

EleutherAI †

Qwen2 †

CodeGen? †

Databricks †

周辺SDK的な †

フレームワーク †

ローコード †

検環 †

Ollama †

Open WebUI †

インストール †

動作確認 †

Streamlit †

インストール †

動作確認 †

Chainlit †

インストール †

動作確認 †

VM費用見積もり †

稼働時間 †

VMサイズ †

付帯費用 †

実費総額 †

研究 †

ローカルRAG †

ファイン・チューニング? †

参考 †

Ollama †

Ubuntu †

Windows †

LLM †

Python Library †

Ollama †

OpenAI †

フレームワーク †

LangChain †

LlamaIndex †

AutoGen †

UI †

Open WebUI †

Ollama-ui †

Streamlit †

ローコード †

LangFlow †

FlowiseAI †

Dify †

... †

ファイン・チューニング †

LoRA †

VM費用見積もり †