AI模型

XJFKKK2024-11-072025-10-08

免费大模型列表

大模型	免费版本	免费限制	控制台（api_key等）	文档地址
讯飞星火大模型	`spark-lite`	tokens：总量无限QPS：2有效期：不限	访问链接	文档查看
百度千帆大模型平台	`yi_34b_chat`, `ERNIE-Speed-8K`, `ERNIE-Speed-128K`, `ERNIE-Lite-8K`, `ERNIE-Lite-8K-0922`, `ERNIE-Tiny-8K`	Lite、Speed-8K：RPM = 300，TPM = 300000Speed-128K：RPM = 60，TPM = 300000	访问链接	文档查看
腾讯混元大模型	`hunyuan-lite`	限制并发数为 5 路	访问链接	链接
Cloudflare Workers AI	`所有模型`	免费可以每天使用1万次，一个月可以30万次；测试版本本的模型无限制	访问链接	文档查看
字节扣子(coze.cn)	豆包·Function call模型(32K)、通义千问-Max(8K)、MiniMax 6.5s(245K)、Moonshot（8K）、Moonshot（32K）、Moonshot（128K）	当前扣子 API 免费供开发者使用，每个空间的 API 请求限额如下：QPS (每秒发送的请求数)：2QPM (每分钟发送的请求数)：60QPD (每天发送的请求数)：3000	访问链接	文档查看
字节火山方舟	doubao系列、Moonshot系列等	2024年5月15日至8月30日期间，为您提供一次独特的机会，即高达5亿tokens的免费权益。	访问链接	文档查看
Llama Family	“Atom-13B-Chat”,”Atom-7B-Chat”,”Atom-1B-Chat”,”Llama3-Chinese-8B-Instruct”	1.每天 8-22 点：接口限速每分钟 20 次并发2.每天 22-次日 8 点：接口限速每分钟 50 次并发	访问链接	文档查看
groq	gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192	rpm为30，rpd为14400，TOKENS PER MINUTE也有限制	访问链接	文档查看
Google Gemini	gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision	15RPM（每分钟请求数）;100万 TPM（每分钟令牌）;1500 RPD（每天请求数）	访问链接	文档查看
硅基流动	Qwen2-7B-Instruct，Qwen2-1.5B-Instruct，Qwen1.5-7B-Chat，glm-4-9b-chat，chatglm3-6b，Yi-1.5-9B-Chat-16K，Yi-1.5-6B-Chat	RPM限制为100，QPS限制为3，更多可以进行申请	访问链接	文档查看