AI模型

免费大模型列表

大模型 免费版本 免费限制 控制台(api_key等) 文档地址
讯飞星火大模型 spark-lite tokens:总量无限QPS:2有效期:不限 访问链接 文档查看
百度千帆大模型平台 yi_34b_chatERNIE-Speed-8KERNIE-Speed-128KERNIE-Lite-8KERNIE-Lite-8K-0922ERNIE-Tiny-8K Lite、Speed-8K:RPM = 300,TPM = 300000Speed-128K:RPM = 60,TPM = 300000 访问链接 文档查看
腾讯混元大模型 hunyuan-lite 限制并发数为 5 路 访问链接 链接
Cloudflare Workers AI 所有模型 免费可以每天使用1万次,一个月可以30万次;测试版本本的模型无限制 访问链接 文档查看
字节扣子(coze.cn) 豆包·Function call模型(32K)、通义千问-Max(8K)、MiniMax 6.5s(245K)、Moonshot(8K)、Moonshot(32K)、Moonshot(128K) 当前扣子 API 免费供开发者使用,每个空间的 API 请求限额如下:QPS (每秒发送的请求数):2QPM (每分钟发送的请求数):60QPD (每天发送的请求数):3000 访问链接 文档查看
字节火山方舟 doubao系列、Moonshot系列等 2024年5月15日至8月30日期间,为您提供一次独特的机会,即高达5亿tokens的免费权益。 访问链接 文档查看
Llama Family “Atom-13B-Chat”,”Atom-7B-Chat”,”Atom-1B-Chat”,”Llama3-Chinese-8B-Instruct” 1.每天 8-22 点:接口限速每分钟 20 次并发2.每天 22-次日 8 点:接口限速每分钟 50 次并发 访问链接 文档查看
groq gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 rpm为30,rpd为14400,TOKENS PER MINUTE也有限制 访问链接 文档查看
Google Gemini gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision 15RPM(每分钟请求数);100万 TPM(每分钟令牌);1500 RPD(每天请求数) 访问链接 文档查看
硅基流动 Qwen2-7B-Instruct,Qwen2-1.5B-Instruct,Qwen1.5-7B-Chat,glm-4-9b-chat,chatglm3-6b,Yi-1.5-9B-Chat-16K,Yi-1.5-6B-Chat RPM限制为100,QPS限制为3,更多可以进行申请 访问链接 文档查看