Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL
Co-authored-by: ManniX-ITA <20623405+mann1x@users.noreply.github.com>
This commit is contained in:
parent
828e4bf101
commit
d40497b9a2
@ -29,6 +29,11 @@ const (
|
|||||||
fileTypeQ2_K_S
|
fileTypeQ2_K_S
|
||||||
fileTypeQ3_K_XS
|
fileTypeQ3_K_XS
|
||||||
fileTypeIQ3_XXS
|
fileTypeIQ3_XXS
|
||||||
|
fileTypeIQ1_S
|
||||||
|
fileTypeIQ4_NL
|
||||||
|
fileTypeIQ3_S
|
||||||
|
fileTypeIQ2_S
|
||||||
|
fileTypeIQ4_XS
|
||||||
|
|
||||||
fileTypeUnknown
|
fileTypeUnknown
|
||||||
)
|
)
|
||||||
@ -77,6 +82,16 @@ func ParseFileType(s string) (fileType, error) {
|
|||||||
return fileTypeQ2_K_S, nil
|
return fileTypeQ2_K_S, nil
|
||||||
case "Q3_K_XS":
|
case "Q3_K_XS":
|
||||||
return fileTypeQ3_K_XS, nil
|
return fileTypeQ3_K_XS, nil
|
||||||
|
case "IQ1_S":
|
||||||
|
return fileTypeIQ1_S, nil
|
||||||
|
case "IQ4_NL":
|
||||||
|
return fileTypeIQ4_NL, nil
|
||||||
|
case "IQ3_S":
|
||||||
|
return fileTypeIQ3_S, nil
|
||||||
|
case "IQ2_S":
|
||||||
|
return fileTypeIQ2_S, nil
|
||||||
|
case "IQ4_XS":
|
||||||
|
return fileTypeIQ4_XS, nil
|
||||||
case "IQ3_XXS":
|
case "IQ3_XXS":
|
||||||
return fileTypeIQ3_XXS, nil
|
return fileTypeIQ3_XXS, nil
|
||||||
default:
|
default:
|
||||||
@ -128,6 +143,16 @@ func (t fileType) String() string {
|
|||||||
return "Q2_K_S"
|
return "Q2_K_S"
|
||||||
case fileTypeQ3_K_XS:
|
case fileTypeQ3_K_XS:
|
||||||
return "Q3_K_XS"
|
return "Q3_K_XS"
|
||||||
|
case fileTypeIQ1_S:
|
||||||
|
return "IQ1_S"
|
||||||
|
case fileTypeIQ4_NL:
|
||||||
|
return "IQ4_NL"
|
||||||
|
case fileTypeIQ3_S:
|
||||||
|
return "IQ3_S"
|
||||||
|
case fileTypeIQ2_S:
|
||||||
|
return "IQ2_S"
|
||||||
|
case fileTypeIQ4_XS:
|
||||||
|
return "IQ4_XS"
|
||||||
case fileTypeIQ3_XXS:
|
case fileTypeIQ3_XXS:
|
||||||
return "IQ3_XXS"
|
return "IQ3_XXS"
|
||||||
default:
|
default:
|
||||||
|
14
llm/ggml.go
14
llm/ggml.go
@ -125,9 +125,9 @@ type Tensor struct {
|
|||||||
|
|
||||||
func (t Tensor) blockSize() uint64 {
|
func (t Tensor) blockSize() uint64 {
|
||||||
switch {
|
switch {
|
||||||
case t.Kind < 2:
|
case t.Kind < 2 || (t.Kind > 23 && t.Kind < 29):
|
||||||
return 1
|
return 1
|
||||||
case t.Kind < 10:
|
case t.Kind < 10 || t.Kind == 20:
|
||||||
return 32
|
return 32
|
||||||
default:
|
default:
|
||||||
return 256
|
return 256
|
||||||
@ -172,6 +172,16 @@ func (t Tensor) typeSize() uint64 {
|
|||||||
return 2 + 2*blockSize/8 + blockSize/32
|
return 2 + 2*blockSize/8 + blockSize/32
|
||||||
case 18: // IQ3_XXS
|
case 18: // IQ3_XXS
|
||||||
return 2 + 3*blockSize/8
|
return 2 + 3*blockSize/8
|
||||||
|
case 19: // IQ1_S
|
||||||
|
return 2 + blockSize/8 + blockSize/16
|
||||||
|
case 20: // IQ4_NL
|
||||||
|
return 2 + blockSize/2
|
||||||
|
case 21: // IQ3_S
|
||||||
|
return 2 + 2*blockSize/8 + blockSize/8 + blockSize/32 + 4
|
||||||
|
case 22: // IQ2_S
|
||||||
|
return 2 + blockSize/4 + blockSize/16
|
||||||
|
case 23: // IQ4_XS
|
||||||
|
return 4 + blockSize/2 + blockSize/64
|
||||||
default:
|
default:
|
||||||
return 0
|
return 0
|
||||||
}
|
}
|
||||||
|
Loading…
x
Reference in New Issue
Block a user