🦥Unsloth ドキュメント

Unsloth は、モデルの実行と学習のためのオープンソースフレームワークです。

Unsloth を使うと、自分のローカルハードウェア上で AI モデルを実行・学習できます。

当社のドキュメントでは、自分のモデルをローカルで実行・学習する手順を案内します。

始める GitHub

Unsloth Studio の紹介

LLM を学習・実行するための、新しいオープンソースのノーコード Web UI。

Unsloth Studio でモデルを実行

ローカルの Mac、Windows、Linux で GGUF モデルを実行。

Qwen3.5

新しい Qwen3.5 の Small と Medium LLM が登場！

NVIDIA Nemotron 3

NVIDIA の新しい 4B と 120B モデルを実行。

より高速な MoE が登場！

より少ない VRAM で MoE LLM を 12 倍高速に学習。

Claude Code と Codex

Claude と OpenAI 経由でローカル LLM を実行する方法を学ぶ。

Qwen3-Coder-Next

新しい 80B のコーディングモデルを実行・ファインチューニング。

GLM-4.7-Flash

エージェント的コーディング向けの 30B モデルを実行・ファインチューニング。

🧬Fine-tuning Guide 📒Unsloth ノートブック

🔮All Our Models 🚀Complete LLM Directory

🦥 なぜ Unsloth？

私たちは以下の背後にいるチームと直接協力しています gpt-oss, Qwen3, Llama 4, Mistral, Gemma 1-3 および Phi-4。そこで私たちは 重大なバグを修正し 、モデル精度を大幅に向上させました。たとえば Andrej Karpathy は、私たちの仕事を称賛しています.
Unsloth は、ローカルでの学習、推論、データ、デプロイを効率化します
Unsloth は 500 以上のモデルの推論と学習をサポートします：画像, TTS, 埋め込み, RL

⭐ 機能

Unsloth では、テキスト用のモデルを実行・学習できます音声, 埋め込み, 画像なども対応しています。Unsloth は、推論と学習の両方に多くの重要機能を提供します：

推論

GGUF、LoRA アダプタ、safetensors など、あらゆるモデルを検索・ダウンロード・実行。
自己修復型ツール呼び出し／Web 検索、および OpenAI 互換 API の呼び出し。
推論パラメータの自動調整とチャットテンプレートの編集。
エクスポートまたは保存モデルを GGUF、16-bit safetensor などに。
出力を比較 2 つの異なるモデルを並べて比較。

学習

学習して RL 500 以上のモデルを約 2 倍高速、VRAM 約 70% 削減で実行（精度低下なし）
フルファインチューニング、事前学習、4-bit、16-bit、FP8 学習をサポート。
データセットを自動作成 PDF、CSV、DOCX ファイルから作成。視覚的なノードワークフローでデータを編集。
可観測性: 学習をライブ監視し、loss、GPU 使用率を追跡し、グラフをカスタマイズ
最も効率的な 強化学習 ライブラリで、GRPO に 80% 少ない VRAM を使用し、 FP8 などに対応。
マルチ GPU は動作しますが、より良いバージョンがまもなく登場します！

クイックスタート

Unsloth は MacOS、Linux、 Windows, NVIDIA、Intel、CPU 構成をサポートしています。こちらを参照： Unsloth の要件。更新するには同じコマンドを使用してください：

MacOS、Linux、WSL：

Windows PowerShell：

Docker

公式の Docker イメージ: unsloth/unsloth を使用してください。現在は Windows、WSL、Linux で動作します。MacOS 対応は近日公開予定です。

Unsloth を起動

新しいモデル

Kimi K2.5

MiniMax-M2.5

GLM-5

ファインチューニングと RL とは？なぜ？

ファインチューニング LLM のは、その振る舞いをカスタマイズし、ドメイン知識を強化し、特定タスクでの性能を最適化します。データセット上で事前学習済みモデル（例: Llama-3.1-8B）をファインチューニングすることで、以下が可能になります。

知識の更新: 新しいドメイン固有の情報を導入する。
振る舞いのカスタマイズ: モデルの口調、性格、応答スタイルを調整する。
タスク向けに最適化: 特定の用途での精度と関連性を向上させる。

強化学習（RL） では、「エージェント」が環境と相互作用し、 フィードバック を報酬または罰則.

の形で受け取りながら意思決定を学習します。 アクション:
モデルが生成するもの（例: 文）。 報酬:
モデルのアクションがどれだけ良かったか／悪かったかを示す信号（例: 応答が指示に従っていたか？役に立ったか？）。 環境:

モデルが取り組んでいるシナリオやタスク（例: ユーザーの質問に答える）。:

ファインチューニングや RL の使用例
見出しが企業にとってプラスかマイナスかを予測するために LLM を活用できます。
契約分析、判例研究、コンプライアンスのために法務テキストで LLM をファインチューニングできます。

ファインチューニング済みモデルは、特定のタスクをより効果的かつ効率的に行うために設計された特化型エージェントだと考えることができます。 ファインチューニングは RAG のすべての機能を再現できますが、その逆はできません。

🤔FAQ + ファインチューニングは自分に合っている？🖥️推論とデプロイ

💡Reinforcement Learning Guide 🦥Dynamic 2.0 GGUFs

次へBeginner? Start here!

最終更新 1 分前

役に立ちましたか？

hashtagUnsloth Studio の紹介

hashtagUnsloth Studio でモデルを実行

hashtag🦥 なぜ Unsloth？

hashtag⭐ 機能

hashtag推論

hashtag学習

hashtagクイックスタート

hashtagMacOS、Linux、WSL：

hashtagWindows PowerShell：

hashtagDocker

hashtagUnsloth を起動

hashtag新しいモデル

hashtagファインチューニングと RL とは？ なぜ？