Fine-tuning – процесс адаптации предобученной модели к специфической задаче или домену через дополнительное обучение на целевых данных. Это критически важная техника, позволяющая leverage огромные вычислительные затраты предобучения для создания специализированных моделей с относительно небольшими ресурсами1.

Зачем нужен fine-tuning

Предобученные модели вроде GPT или BERT обладают общими языковыми способностями, но могут недостаточно хорошо работать на специфических задачах или доменах. Fine-tuning решает эту проблему, адаптируя модель под конкретные требования.

Сценарий Проблема base модели Решение через fine-tuning Требуемые данные
Специфичный домен Недостаточно знаний медицинской/юридической терминологии Обучение на доменных текстах 10K-100K примеров
Специфичная задача Общая генерация не оптимальна для классификации Supervised fine-tuning на labeled данных 1K-10K примеров
Формат вывода Нестабильный формат ответов Обучение на примерах нужного формата 500-5K примеров
Стиль и тон Не соответствует корпоративному стилю Обучение на примерах желаемого стиля 1K-5K примеров