BACK
2024-03-21

NemoLLM

NemoLLMを動かすべく、奮闘中の日々。
中、ということは、現時点では動いていない、ということですが、、、
だんだん辛くなってきたのでセーブポイント。

Nemo Frameworkは生成AIの推論と訓練を1パッケージで利用できる(はず)のフレームワークです。
なんかガードレールとかも入ってるらしい。
しかもDockerイメージもあり、これは便利! と思い、トライしているのですが、
コンテナは入ったものの、起動してもドライバがないよ!と怒られる。

可能性としては
- コンテナ用ドライバが実は入っていない(これはコマンドで調べた感じは問題なさそう
- コンテナ用ドライバのバージョンが非対応(対応バージョンが書いてない、、
- 起動オプションが必要(ありえそうだが、見つけられない、、

どうもGDX(nVIDIAのクラウド)で使うためのもので、
それ以外は公開しているけど自助努力で頼む、な空気を感じている、、
(木の精かもしれないが)

道筋は今のところこんな感じ。
1. サーバーを借りる
2. イメージをダウンロード
3. 起動(できず

サーバーは、下記の選択肢があったが、GPUそろばんに落ち着いた。
- GPUそろばん
- T4(16GB)
- 50円/H
- 停止中は無課金
- コンテナ用ドライバセットアップ済み
- 借りる時に空きマシンが無いと起動できない

- ConoHA for AI
- L4(24GB)
- 169円/H
- テンプレートがある
- 課金を止めるにはサーバを削除する必要あり(VPSだから?)
- 要審査(1day)

- Compute Engine(GCP)
- T4(16GB)
- $0.4/H(スペック次第)
- ドライバはセットアップ済み?
- 停止中は微課金?

Comments

あと、そもそもT4に対応していない、という可能性もある。
どこかで、RTX4x以上、と書かれていたので、対応コアが割と新しいものだけという可能性あり。
しかし、全部英語なので、Geminiに助けてもらいながら解読中、、、
コンテナってREADMEとか無いのだろうか
お金があればローカルにPC買ってドーンしたい!
NemoLLM使ってる日本人居ないかな、、、日本語資料きぼん
あと、GPUそろばんの管理画面は割としっかりしていて、好印象。
UIもいいし、請求アラートとかもある。
こういう細かいところも、やっぱり重要だよなぁ。サービス比較的に。
偉い人に説明しづらいけど、、、
GPUそろばんのインスタンスが空かない、、
結局GCPで借りるしか無いのだろうか。
コンテナタイプはH100とA100しか対応していないってこと?
https://docs.nvidia.com/nemo-framework/user-guide/latest/deployingthenemoframeworkmodel.html#supported-model-and-gpus
Nemo gardrails
https://qiita.com/mana-murakami/items/336711f7d761a0b2368d
あれ、M1対応している?
https://github.com/NVIDIA/NeMo?tab=readme-ov-file#mac-computers-with-apple-silicon
nemoのユーザーガイド
PDFでDLできる。
https://docs.nvidia.com/deeplearning/nemo/user-guide/docs/en/main/core/neural_modules.html
M1は学習には対応してなかったtt
まあ、仕方ないが、、
なんかGPUそろばんのアクセスサーバが不安定だな、、、(汗
ルーターが弾いてたっぽい。帰宅したらなおった
name:  空(Bot避け):


BACK