Type Alias: GgufMetadataDefaultArchitectureType

type GgufMetadataDefaultArchitectureType = {
  vocab_size?: number;
  context_length?: number;
  embedding_length?: number;
  block_count?: number;
  full_attention_interval?: number;
  feed_forward_length?: number;
  use_parallel_residual?: boolean;
  tensor_data_layout?: string;
  expert_count?: number;
  expert_used_count?: number;
  pooling_type?: GgufMetadataArchitecturePoolingType;
  logit_scale?: number;
  token_shift_count?: number;
  attention?: {
     head_count?: number;
     head_count_kv?: number | number[];
     max_alibi_bias?: number;
     clamp_kqv?: number;
     layer_norm_epsilon?: number;
     layer_norm_rms_epsilon?: number;
     key_length?: number;
     value_length?: number;
     key_length_swa?: number;
     value_length_swa?: number;
     sliding_window?: number;
     sliding_window_pattern?: number | number[];
     shared_kv_layers?: number;
     causal?: boolean;
  };
  rope?: {
     dimension_count?: number;
     freq_base?: number;
     freq_base_swa?: number;
     scale_linear?: number;
     scaling?: {
        type?: "none" | "linear" | "yarn" | string;
        factor?: number;
        original_context_length?: number;
        finetuned?: boolean;
     };
  };
  ssm?: {
     conv_kernel?: number;
     inner_size?: number;
     state_size?: number;
     time_step_rank?: number;
     group_count?: number;
  };
  kda?: {
     head_dim?: number;
  };
  shortconv?: {
     l_cache?: number;
  };
  wkv?: {
     head_size?: number;
  };
};

Defined in: gguf/types/GgufMetadataTypes.ts:360

Properties

vocab_size?

readonly optional vocab_size: number;

Defined in: gguf/types/GgufMetadataTypes.ts:361

context_length?

readonly optional context_length: number;

Defined in: gguf/types/GgufMetadataTypes.ts:362

embedding_length?

readonly optional embedding_length: number;

Defined in: gguf/types/GgufMetadataTypes.ts:363

block_count?

readonly optional block_count: number;

Defined in: gguf/types/GgufMetadataTypes.ts:364

full_attention_interval?

readonly optional full_attention_interval: number;

Defined in: gguf/types/GgufMetadataTypes.ts:365

feed_forward_length?

readonly optional feed_forward_length: number;

Defined in: gguf/types/GgufMetadataTypes.ts:366

use_parallel_residual?

readonly optional use_parallel_residual: boolean;

Defined in: gguf/types/GgufMetadataTypes.ts:367

tensor_data_layout?

readonly optional tensor_data_layout: string;

Defined in: gguf/types/GgufMetadataTypes.ts:368

expert_count?

readonly optional expert_count: number;

Defined in: gguf/types/GgufMetadataTypes.ts:369

expert_used_count?

readonly optional expert_used_count: number;

Defined in: gguf/types/GgufMetadataTypes.ts:370

pooling_type?

readonly optional pooling_type: GgufMetadataArchitecturePoolingType;

Defined in: gguf/types/GgufMetadataTypes.ts:371

logit_scale?

readonly optional logit_scale: number;

Defined in: gguf/types/GgufMetadataTypes.ts:372

token_shift_count?

readonly optional token_shift_count: number;

Defined in: gguf/types/GgufMetadataTypes.ts:373

attention?

readonly optional attention: {
  head_count?: number;
  head_count_kv?: number | number[];
  max_alibi_bias?: number;
  clamp_kqv?: number;
  layer_norm_epsilon?: number;
  layer_norm_rms_epsilon?: number;
  key_length?: number;
  value_length?: number;
  key_length_swa?: number;
  value_length_swa?: number;
  sliding_window?: number;
  sliding_window_pattern?: number | number[];
  shared_kv_layers?: number;
  causal?: boolean;
};

Defined in: gguf/types/GgufMetadataTypes.ts:375

head_count?

readonly optional head_count: number;

head_count_kv?

readonly optional head_count_kv: number | number[];

max_alibi_bias?

readonly optional max_alibi_bias: number;

clamp_kqv?

readonly optional clamp_kqv: number;

layer_norm_epsilon?

readonly optional layer_norm_epsilon: number;

layer_norm_rms_epsilon?

readonly optional layer_norm_rms_epsilon: number;

key_length?

readonly optional key_length: number;

value_length?

readonly optional value_length: number;

key_length_swa?

readonly optional key_length_swa: number;

value_length_swa?

readonly optional value_length_swa: number;

sliding_window?

readonly optional sliding_window: number;

sliding_window_pattern?

readonly optional sliding_window_pattern: number | number[];

shared_kv_layers?

readonly optional shared_kv_layers: number;

causal?

readonly optional causal: boolean;

rope?

readonly optional rope: {
  dimension_count?: number;
  freq_base?: number;
  freq_base_swa?: number;
  scale_linear?: number;
  scaling?: {
     type?: "none" | "linear" | "yarn" | string;
     factor?: number;
     original_context_length?: number;
     finetuned?: boolean;
  };
};

Defined in: gguf/types/GgufMetadataTypes.ts:392

dimension_count?

readonly optional dimension_count: number;

freq_base?

readonly optional freq_base: number;

freq_base_swa?

readonly optional freq_base_swa: number;

scale_linear?

readonly optional scale_linear: number;

scaling?

readonly optional scaling: {
  type?: "none" | "linear" | "yarn" | string;
  factor?: number;
  original_context_length?: number;
  finetuned?: boolean;
};

scaling.type?

readonly optional type: "none" | "linear" | "yarn" | string;

scaling.factor?

readonly optional factor: number;

scaling.original_context_length?

readonly optional original_context_length: number;

scaling.finetuned?

readonly optional finetuned: boolean;

ssm?

readonly optional ssm: {
  conv_kernel?: number;
  inner_size?: number;
  state_size?: number;
  time_step_rank?: number;
  group_count?: number;
};

Defined in: gguf/types/GgufMetadataTypes.ts:405

conv_kernel?

readonly optional conv_kernel: number;

inner_size?

readonly optional inner_size: number;

state_size?

readonly optional state_size: number;

time_step_rank?

readonly optional time_step_rank: number;

group_count?

readonly optional group_count: number;

kda?

readonly optional kda: {
  head_dim?: number;
};

Defined in: gguf/types/GgufMetadataTypes.ts:413

head_dim?

readonly optional head_dim: number;

shortconv?

readonly optional shortconv: {
  l_cache?: number;
};

Defined in: gguf/types/GgufMetadataTypes.ts:417

l_cache?

readonly optional l_cache: number;

wkv?

readonly optional wkv: {
  head_size?: number;
};

Defined in: gguf/types/GgufMetadataTypes.ts:421

head_size?

readonly optional head_size: number;

LlamaModelTokens

ChatModelResponse

GgufMetadata

LlamaContextOptions

BatchingOptions

LlamaChatSessionOptions

LLamaChatPromptOptions

JinjaTemplateChatWrapperOptions

Type Alias: GgufMetadataDefaultArchitectureType ​

Properties ​

vocab_size? ​

context_length? ​

embedding_length? ​

block_count? ​

full_attention_interval? ​

feed_forward_length? ​

use_parallel_residual? ​

tensor_data_layout? ​

expert_count? ​

expert_used_count? ​

pooling_type? ​

logit_scale? ​

token_shift_count? ​

attention? ​

head_count? ​

head_count_kv? ​

max_alibi_bias? ​

clamp_kqv? ​

layer_norm_epsilon? ​

layer_norm_rms_epsilon? ​

key_length? ​

value_length? ​

key_length_swa? ​

value_length_swa? ​

sliding_window? ​

sliding_window_pattern? ​

shared_kv_layers? ​

causal? ​

rope? ​

dimension_count? ​

freq_base? ​

freq_base_swa? ​

scale_linear? ​

scaling? ​

scaling.type? ​

scaling.factor? ​

scaling.original_context_length? ​

scaling.finetuned? ​

ssm? ​

conv_kernel? ​

inner_size? ​

state_size? ​

time_step_rank? ​

group_count? ​

kda? ​

head_dim? ​

shortconv? ​

l_cache? ​

wkv? ​

head_size? ​

Type Alias: GgufMetadataDefaultArchitectureType

Properties

vocab_size?

context_length?

embedding_length?

block_count?

full_attention_interval?

feed_forward_length?

use_parallel_residual?

tensor_data_layout?

expert_count?

expert_used_count?

pooling_type?

logit_scale?

token_shift_count?

attention?

head_count?

head_count_kv?

max_alibi_bias?

clamp_kqv?

layer_norm_epsilon?

layer_norm_rms_epsilon?

key_length?

value_length?

key_length_swa?

value_length_swa?

sliding_window?

sliding_window_pattern?

shared_kv_layers?

causal?

rope?

dimension_count?

freq_base?

freq_base_swa?

scale_linear?

scaling?

scaling.type?

scaling.factor?

scaling.original_context_length?

scaling.finetuned?

ssm?

conv_kernel?

inner_size?

state_size?

time_step_rank?

group_count?

kda?

head_dim?

shortconv?

l_cache?

wkv?

head_size?