🦥Unsloth ドキュメント

Unsloth は、モデルの実行と学習のためのオープンソースフレームワークです。

Unsloth を使うと、自分のローカルハードウェア上で AI モデルを実行・学習できます。

当社のドキュメントでは、自分のモデルをローカルで実行・学習する手順を案内します。

始める GitHub

🦥 なぜ Unsloth?

⭐ 機能

Unsloth では、テキスト用のモデルを実行・学習できます 音声arrow-up-right, 埋め込みarrow-up-right, 画像arrow-up-right なども対応しています。Unsloth は、推論と学習の両方に多くの重要機能を提供します:

推論

学習

  • 学習して RL 500 以上のモデルを約 2 倍高速、VRAM 約 70% 削減で実行(精度低下なし)

  • フルファインチューニング、事前学習、4-bit、16-bit、FP8 学習をサポート。

  • データセットを自動作成 PDF、CSV、DOCX ファイルから作成。視覚的なノードワークフローでデータを編集。

  • 可観測性: 学習をライブ監視し、loss、GPU 使用率を追跡し、グラフをカスタマイズ

  • 最も効率的な 強化学習 ライブラリで、GRPO に 80% 少ない VRAM を使用し、 FP8 などに対応。

  • マルチ GPU は動作しますが、より良いバージョンがまもなく登場します!

クイックスタート

Unsloth は MacOS、Linux、 Windows, NVIDIA、Intel、CPU 構成をサポートしています。こちらを参照: Unsloth の要件。更新するには同じコマンドを使用してください:

MacOS、Linux、WSL:

Windows PowerShell:

Docker

公式の Docker イメージ: unsloth/unslotharrow-up-right を使用してください。現在は Windows、WSL、Linux で動作します。MacOS 対応は近日公開予定です。

Unsloth を起動

新しいモデル

ファインチューニングと RL とは? なぜ?

ファインチューニング LLM の は、その振る舞いをカスタマイズし、ドメイン知識を強化し、特定タスクでの性能を最適化します。データセット上で事前学習済みモデル(例: Llama-3.1-8B)をファインチューニングすることで、以下が可能になります。

  • 知識の更新: 新しいドメイン固有の情報を導入する。

  • 振る舞いのカスタマイズ: モデルの口調、性格、応答スタイルを調整する。

  • タスク向けに最適化: 特定の用途での精度と関連性を向上させる。

強化学習(RL) では、「エージェント」が環境と相互作用し、 フィードバック報酬 または 罰則.

  • の形で受け取りながら意思決定を学習します。 アクション:

  • モデルが生成するもの(例: 文)。 報酬:

  • モデルのアクションがどれだけ良かったか/悪かったかを示す信号(例: 応答が指示に従っていたか? 役に立ったか?)。 環境:

モデルが取り組んでいるシナリオやタスク(例: ユーザーの質問に答える)。:

  • ファインチューニングや RL の使用例

  • 見出しが企業にとってプラスかマイナスかを予測するために LLM を活用できます。

  • 契約分析、判例研究、コンプライアンスのために法務テキストで LLM をファインチューニングできます。

ファインチューニング済みモデルは、特定のタスクをより効果的かつ効率的に行うために設計された特化型エージェントだと考えることができます。 ファインチューニングは RAG のすべての機能を再現できますが、その逆はできません。

最終更新

役に立ちましたか?