1
1
import { AIChatModelCard } from '@/types/aiModel' ;
2
2
3
+ // https://groq.com/pricing/
4
+ // https://console.groq.com/docs/models
5
+
3
6
const groqChatModels : AIChatModelCard [ ] = [
4
7
{
5
8
abilities : {
9
+ functionCall : true ,
6
10
reasoning : true ,
7
11
} ,
8
- contextWindowTokens : 128_000 ,
9
- description :
10
- 'DeepSeek R1——DeepSeek 套件中更大更智能的模型——被蒸馏到 Llama 70B 架构中。基于基准测试和人工评估,该模型比原始 Llama 70B 更智能,尤其在需要数学和事实精确性的任务上表现出色。' ,
11
- displayName : 'DeepSeek R1 (Distil-Llama 70B)' ,
12
+ contextWindowTokens : 131_072 ,
13
+ displayName : 'DeepSeek R1 Distill Llama 70B' ,
12
14
enabled : true ,
13
15
id : 'deepseek-r1-distill-llama-70b' ,
16
+ pricing : {
17
+ input : 0.75 , // 0.75 - 5.00
18
+ output : 0.99 , // 0.99 - 5.00
19
+ } ,
14
20
type : 'chat' ,
15
21
} ,
16
22
{
17
- abilities : {
18
- functionCall : true ,
19
- } ,
20
23
contextWindowTokens : 131_072 ,
21
- description :
22
- 'Meta Llama 3.3 多语言大语言模型 ( LLM ) 是 70B(文本输入/文本输出)中的预训练和指令调整生成模型。 Llama 3.3 指令调整的纯文本模型针对多语言对话用例进行了优化,并且在常见行业基准上优于许多可用的开源和封闭式聊天模型。' ,
23
- displayName : 'Llama 3.3 70B' ,
24
- enabled : true ,
25
- id : 'llama-3.3-70b-versatile' ,
26
- maxOutput : 8192 ,
24
+ displayName : 'DeepSeek R1 Distill Llama 70B SpecDec' ,
25
+ id : 'deepseek-r1-distill-llama-70b-specdec' ,
26
+ maxOutput : 16_384 ,
27
27
pricing : {
28
- input : 0.05 ,
29
- output : 0.08 ,
28
+ input : 0.75 ,
29
+ output : 0.99 ,
30
30
} ,
31
31
type : 'chat' ,
32
32
} ,
33
33
{
34
34
abilities : {
35
- vision : true ,
35
+ functionCall : true ,
36
+ reasoning : true ,
36
37
} ,
37
- contextWindowTokens : 8192 ,
38
- description :
39
- 'Llama 3.2 旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,跨越了语言生成和视觉推理之间的鸿沟。' ,
40
- displayName : 'Llama 3.2 11B Vision (Preview)' ,
38
+ contextWindowTokens : 131_072 ,
39
+ displayName : 'DeepSeek R1 Distill Qwen 32B' ,
41
40
enabled : true ,
42
- id : 'llama-3.2-11b-vision-preview ' ,
43
- maxOutput : 8192 ,
41
+ id : 'deepseek-r1-distill-qwen-32b ' ,
42
+ maxOutput : 16_384 ,
44
43
pricing : {
45
- input : 0.05 ,
46
- output : 0.08 ,
44
+ input : 0.69 ,
45
+ output : 0.69 ,
47
46
} ,
48
47
type : 'chat' ,
49
48
} ,
50
49
{
51
50
abilities : {
52
- vision : true ,
51
+ functionCall : true ,
53
52
} ,
54
53
contextWindowTokens : 8192 ,
55
- description :
56
- 'Llama 3.2 旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,跨越了语言生成和视觉推理之间的鸿沟。' ,
57
- displayName : 'Llama 3.2 90B Vision (Preview)' ,
58
- enabled : true ,
59
- id : 'llama-3.2-90b-vision-preview' ,
60
- maxOutput : 8192 ,
54
+ description : 'Gemma 2 9B 是一款优化用于特定任务和工具整合的模型。' ,
55
+ displayName : 'Gemma 2 9B' ,
56
+ id : 'gemma2-9b-it' ,
61
57
pricing : {
62
- input : 0.59 ,
63
- output : 0.79 ,
58
+ input : 0.2 ,
59
+ output : 0.2 ,
64
60
} ,
65
61
type : 'chat' ,
66
62
} ,
@@ -69,10 +65,8 @@ const groqChatModels: AIChatModelCard[] = [
69
65
functionCall : true ,
70
66
} ,
71
67
contextWindowTokens : 131_072 ,
72
- description :
73
- 'Llama 3.1 8B 是一款高效能模型,提供了快速的文本生成能力,非常适合需要大规模效率和成本效益的应用场景。' ,
74
- displayName : 'Llama 3.1 8B' ,
75
- enabled : true ,
68
+ description : 'Llama 3.1 8B 是一款高效能模型,提供了快速的文本生成能力,非常适合需要大规模效率和成本效益的应用场景。' ,
69
+ displayName : 'Llama 3.1 8B Instant' ,
76
70
id : 'llama-3.1-8b-instant' ,
77
71
maxOutput : 8192 ,
78
72
pricing : {
@@ -83,103 +77,102 @@ const groqChatModels: AIChatModelCard[] = [
83
77
} ,
84
78
{
85
79
abilities : {
86
- functionCall : true ,
80
+ vision : true ,
87
81
} ,
88
82
contextWindowTokens : 131_072 ,
89
- description :
90
- 'Llama 3.1 70B 提供更强大的AI推理能力,适合复杂应用,支持超多的计算处理并保证高效和准确率。' ,
91
- displayName : 'Llama 3.1 70B' ,
92
- enabled : true ,
93
- id : 'llama-3.1-70b-versatile' ,
83
+ description : 'Llama 3.2 旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,跨越了语言生成和视觉推理之间的鸿沟。' ,
84
+ displayName : 'Llama 3.2 11B Vision (Preview)' ,
85
+ id : 'llama-3.2-11b-vision-preview' ,
94
86
maxOutput : 8192 ,
95
87
pricing : {
96
- input : 0.59 ,
97
- output : 0.79 ,
88
+ input : 0.18 ,
89
+ output : 0.18 ,
98
90
} ,
99
91
type : 'chat' ,
100
92
} ,
101
93
{
102
94
abilities : {
103
- functionCall : true ,
95
+ vision : true ,
104
96
} ,
105
- contextWindowTokens : 8192 ,
106
- description : 'Llama 3 Groq 8B Tool Use 是针对高效工具使用优化的模型,支持快速并行计算。' ,
107
- displayName : 'Llama 3 Groq 8B Tool Use (Preview)' ,
108
- id : 'llama3-groq-8b-8192-tool-use-preview' ,
97
+ contextWindowTokens : 131_072 ,
98
+ description : 'Llama 3.2 旨在处理结合视觉和文本数据的任务。它在图像描述和视觉问答等任务中表现出色,跨越了语言生成和视觉推理之间的鸿沟。' ,
99
+ displayName : 'Llama 3.2 90B Vision (Preview)' ,
100
+ enabled : true ,
101
+ id : 'llama-3.2-90b-vision-preview' ,
102
+ maxOutput : 8192 ,
109
103
pricing : {
110
- input : 0.19 ,
111
- output : 0.19 ,
104
+ input : 0.9 ,
105
+ output : 0.9 ,
112
106
} ,
113
107
type : 'chat' ,
114
108
} ,
115
109
{
116
- abilities : {
117
- functionCall : true ,
118
- } ,
119
- contextWindowTokens : 8192 ,
120
- description : 'Llama 3 Groq 70B Tool Use 提供强大的工具调用能力,支持复杂任务的高效处理。' ,
121
- displayName : 'Llama 3 Groq 70B Tool Use (Preview)' ,
122
- id : 'llama3-groq-70b-8192-tool-use-preview' ,
110
+ contextWindowTokens : 131_072 ,
111
+ displayName : 'Llama 3.2 1B (Preview)' ,
112
+ id : 'llama-3.2-1b-preview' ,
113
+ maxOutput : 8192 ,
123
114
pricing : {
124
- input : 0.89 ,
125
- output : 0.89 ,
115
+ input : 0.04 ,
116
+ output : 0.04 ,
126
117
} ,
127
118
type : 'chat' ,
128
119
} ,
129
120
{
130
- abilities : {
131
- functionCall : true ,
121
+ contextWindowTokens : 131_072 ,
122
+ displayName : 'Llama 3.2 3B (Preview)' ,
123
+ id : 'llama-3.2-3b-preview' ,
124
+ maxOutput : 8192 ,
125
+ pricing : {
126
+ input : 0.06 ,
127
+ output : 0.06 ,
132
128
} ,
129
+ type : 'chat' ,
130
+ } ,
131
+ {
133
132
contextWindowTokens : 8192 ,
134
- description : 'Meta Llama 3 8B 带来优质的推理效能,适合多场景应用需求。' ,
135
- displayName : 'Meta Llama 3 8B' ,
136
- id : 'llama3-8b-8192' ,
133
+ displayName : 'Llama 3.3 70B SpecDec' ,
134
+ id : 'llama-3.3-70b-specdec' ,
137
135
pricing : {
138
- input : 0.05 ,
139
- output : 0.08 ,
136
+ input : 0.59 ,
137
+ output : 0.99 ,
140
138
} ,
141
139
type : 'chat' ,
142
140
} ,
143
141
{
144
142
abilities : {
145
143
functionCall : true ,
146
144
} ,
147
- contextWindowTokens : 8192 ,
148
- description : 'Meta Llama 3 70B 提供无与伦比的复杂性处理能力,为高要求项目量身定制。' ,
149
- displayName : 'Meta Llama 3 70B' ,
150
- id : 'llama3-70b-8192' ,
145
+ contextWindowTokens : 131_072 ,
146
+ description : 'Meta Llama 3.3 多语言大语言模型 ( LLM ) 是 70B(文本输入/文本输出)中的预训练和指令调整生成模型。 Llama 3.3 指令调整的纯文本模型针对多语言对话用例进行了优化,并且在常见行业基准上优于许多可用的开源和封闭式聊天模型。' ,
147
+ displayName : 'Llama 3.3 70B Versatile' ,
148
+ enabled : true ,
149
+ id : 'llama-3.3-70b-versatile' ,
150
+ maxOutput : 32_768 ,
151
151
pricing : {
152
152
input : 0.59 ,
153
153
output : 0.79 ,
154
154
} ,
155
155
type : 'chat' ,
156
156
} ,
157
157
{
158
- abilities : {
159
- functionCall : true ,
160
- } ,
161
158
contextWindowTokens : 8192 ,
162
- description : 'Gemma 2 9B 是一款优化用于特定任务和工具整合的模型。' ,
163
- displayName : 'Gemma 2 9B' ,
164
- enabled : true ,
165
- id : 'gemma2-9b-it' ,
159
+ description : 'Meta Llama 3 70B 提供无与伦比的复杂性处理能力,为高要求项目量身定制。' ,
160
+ displayName : 'Llama 3 70B' ,
161
+ id : 'llama3-70b-8192' ,
166
162
pricing : {
167
- input : 0.2 ,
168
- output : 0.2 ,
163
+ input : 0.59 ,
164
+ output : 0.79 ,
169
165
} ,
170
166
type : 'chat' ,
171
167
} ,
172
168
{
173
- abilities : {
174
- functionCall : true ,
175
- } ,
176
169
contextWindowTokens : 8192 ,
177
- description : 'Gemma 7B 适合中小规模任务处理,兼具成本效益 。' ,
178
- displayName : 'Gemma 7B ' ,
179
- id : 'gemma-7b-it ' ,
170
+ description : 'Meta Llama 3 8B 带来优质的推理效能,适合多场景应用需求 。' ,
171
+ displayName : 'Llama 3 8B ' ,
172
+ id : 'llama3-8b-8192 ' ,
180
173
pricing : {
181
- input : 0.07 ,
182
- output : 0.07 ,
174
+ input : 0.05 ,
175
+ output : 0.08 ,
183
176
} ,
184
177
type : 'chat' ,
185
178
} ,
@@ -189,7 +182,7 @@ const groqChatModels: AIChatModelCard[] = [
189
182
} ,
190
183
contextWindowTokens : 32_768 ,
191
184
description : 'Mixtral 8x7B 提供高容错的并行计算能力,适合复杂任务。' ,
192
- displayName : 'Mixtral 8x7B' ,
185
+ displayName : 'Mixtral 8x7B Instruct ' ,
193
186
id : 'mixtral-8x7b-32768' ,
194
187
pricing : {
195
188
input : 0.24 ,
@@ -199,12 +192,35 @@ const groqChatModels: AIChatModelCard[] = [
199
192
} ,
200
193
{
201
194
abilities : {
202
- vision : true ,
195
+ functionCall : true ,
196
+ } ,
197
+ contextWindowTokens : 131_072 ,
198
+ displayName : 'Qwen 2.5 32B' ,
199
+ id : 'qwen-2.5-32b' ,
200
+ pricing : {
201
+ input : 0.79 ,
202
+ output : 0.79 ,
203
+ } ,
204
+ type : 'chat' ,
205
+ } ,
206
+ {
207
+ contextWindowTokens : 131_072 ,
208
+ displayName : 'Qwen 2.5 Coder 32B' ,
209
+ id : 'qwen-2.5-coder-32b' ,
210
+ pricing : {
211
+ input : 0.79 ,
212
+ output : 0.79 ,
213
+ } ,
214
+ type : 'chat' ,
215
+ } ,
216
+ {
217
+ contextWindowTokens : 8192 ,
218
+ displayName : 'Llama Guard 3 8B' ,
219
+ id : 'llama-guard-3-8b' ,
220
+ pricing : {
221
+ input : 0.2 ,
222
+ output : 0.2 ,
203
223
} ,
204
- contextWindowTokens : 4096 ,
205
- description : 'LLaVA 1.5 7B 提供视觉处理能力融合,通过视觉信息输入生成复杂输出。' ,
206
- displayName : 'LLaVA 1.5 7B' ,
207
- id : 'llava-v1.5-7b-4096-preview' ,
208
224
type : 'chat' ,
209
225
} ,
210
226
] ;
0 commit comments