a safetensors directory; or
Un directorio safetensors; o
Si estás creando un modelo desde un directorio safetensors o desde un archivo GGUF, debes crear un blob para cada uno de los archivos y luego usar el nombre del archivo y el resumen SHA256 asociado con cada blob en el campo files.Parámetros#
model: nombre del modelo a crear
from: (opcional) nombre de un modelo existente desde el cual crear el nuevo modelo
files: (opcional) un diccionario de nombres de archivo a resúmenes SHA256 de blobs para crear el modelo desde
adapters: (opcional) un diccionario de nombres de archivo a resúmenes SHA256 de blobs para adaptadores LORA
template: (opcional) la plantilla de prompt para el modelo
license: (opcional) una cadena o lista de cadenas que contienen la licencia o licencias para el modelo
system: (opcional) una cadena que contiene el prompt del sistema para el modelo
parameters: (opcional) un diccionario de parámetros para el modelo (ver Modelfile para una lista de parámetros)messages: (opcional) una lista de objetos de mensaje utilizados para crear una conversación
stream: (opcional) si false, la respuesta se devolverá como un único objeto de respuesta, en lugar de un flujo de objetos
quantize (opcional): cuantificar un modelo no cuantificado (por ejemplo, float16)
Tipos de cuantificación#
| Type | Recommended |
|---|
| q2_K | |
| q3_K_L | |
| q3_K_M | |
| q3_K_S | |
| q4_0 | |
| q4_1 | |
| q4_K_M | * |
| q4_K_S | |
| q5_0 | |
| q5_1 | |
| q5_K_M | |
| q5_K_S | |
| q6_K | |
| q8_0 | * |
If you are creating a model from a safetensors directory or from a GGUF file, you must create a blob for each of the files and then use the file name and SHA256 digest associated with each blob in the files field. | |
Parameters#
model: name of the model to create
from: (optional) name of an existing model to create the new model from
files: (optional) a dictionary of file names to SHA256 digests of blobs to create the model from
adapters: (optional) a dictionary of file names to SHA256 digests of blobs for LORA adapters
template: (optional) the prompt template for the model
license: (optional) a string or list of strings containing the license or licenses for the model
system: (optional) a string containing the system prompt for the model
parameters: (optional) a dictionary of parameters for the model (see Modelfile for a list of parameters)messages: (optional) a list of message objects used to create a conversation
stream: (optional) if false the response will be returned as a single response object, rather than a stream of objects
quantize (optional): quantize a non-quantized (e.g. float16) model
Quantization types#
| Type | Recommended |
|---|
| q2_K | |
| q3_K_L | |
| q3_K_M | |
| q3_K_S | |
| q4_0 | |
| q4_1 | |
| q4_K_M | * |
| q4_K_S | |
| q5_0 | |
| q5_1 | |
| q5_K_M | |
| q5_K_S | |
| q6_K | |
| q8_0 | * |
Modified at 2025-03-14 09:24:02