模型选择指南

模型概览

LawChat 提供多个不同规格的 AI 模型，每个模型针对不同的使用场景进行了优化。您可以根据任务复杂度、响应速度需求和会员等级来选择合适的模型。

模型列表

快速响应系列

适合简单问答和日常咨询，响应速度快，适合高频互动。

模型	参数量	响应速度	会员要求	适用场景
Fast Flash	4B	140 tokens/s	Free	快速查询、简单法律咨询、日常问答
Flash	8B	80 tokens/s	Free	文书起草、合同审查、常规法律分析

专业推理系列

适合复杂案件分析和专业法律文书生成，推理能力强，回答质量高。

模型	参数量	响应速度	会员要求	适用场景
Cube	14B	60 tokens/s	Pro	企业法务、常规诉讼分析、合同审查
Plus	32B	45 tokens/s	Pro	复杂诉讼策略、重大利益决策、深度法律分析
Max	200B (MoE)	30 tokens/s	Max	疑难案件研判、企业级法律服务、学术研究

模型定位详解

Fast Flash（极速模型）

定位：轻量级快速响应 适合场景：

快速法律条文查询
简单法律问题解答
日常咨询对话
高频率互动场景

特点：

响应速度最快，几乎实时回复
适合处理直接、明确的问题
消耗资源最少，性价比高

示例问题：

“劳动法规定的加班费计算标准是什么？”
“起诉需要准备哪些材料？”
“合同生效的基本条件有哪些？“

Flash（平衡模型）

定位：性能与速度的平衡 适合场景：

日常法律文书起草
基础合同审查
一般法律咨询
批量文档处理

特点：

速度与质量的平衡点
适合大多数日常法律任务
Free 会员的主力模型

示例问题：

“帮我起草一份简单的房屋租赁合同”
“审查这份劳动合同的条款是否合法”
“写一份离婚协议书”

Cube（商用模型）

定位：主流商用级别 适合场景：

律所内部助手
企业法务常规审查
中等复杂度案件分析
法律文书标准化生成

特点：

Pro 会员入门级模型
处理复杂度适中的法律任务
输出质量稳定可靠

示例问题：

“分析这个劳动争议案件的法律关系”
“为这家公司起草一份标准的劳动合同模板”
“审查这份商业合同的潜在风险”

Plus（专家模型）

定位：专家级推理能力 适合场景：

复杂诉讼策略分析
重大利益决策支持
深度法律研究
多法律关系交叉分析

特点：

强大的逻辑推理能力
能处理复杂案情
输出更加严谨和专业

示例问题：

“这个跨境并购案件涉及哪些法律风险，如何规避？”
“分析这个知识产权侵权案件的胜诉概率和赔偿金额”
“为这个复杂的股权纠纷设计诉讼策略”

Max（旗舰模型）

定位：顶级旗舰，接近资深律师水平 适合场景：

疑难案件研判
企业级法律服务
学术研究与论文写作
重大复杂交易结构设计

特点：

最强的推理和分析能力
深度理解复杂法律关系
输出质量接近专业律师
支持超长上下文（最高 1M tokens）

示例问题：

“分析这个涉及多个法律领域的复杂案件，给出全面的法律意见”
“为这个跨国交易设计完整的法律架构和风险控制方案”
“深入研究这个法律问题的学术争议和实务处理”

如何选择适合的模型

根据问题复杂度选择

简单查询 → Fast Flash / Flash
常规文书 → Flash / Cube
复杂分析 → Plus
疑难案件 → Max

根据使用频率选择

高频使用：优先使用 Fast Flash/Flash 处理简单问题，节省额度
重要任务：使用 Plus/Max 确保输出质量
批量处理：使用 Flash/Cube 平衡效率和质量

根据会员等级选择

会员等级	可用模型	建议
Free	Fast Flash, Flash	日常咨询使用 Fast Flash，重要文书用 Flash
Pro	全部模型（Max 除外）	常规任务用 Cube，复杂分析用 Plus
Max	全部模型	根据任务复杂度灵活选择

各模型适用场景总结

按任务类型分类

法律咨询类

简单咨询：Fast Flash
一般咨询：Flash
深度咨询：Plus/Max

文书起草类

简单文书：Flash
标准文书：Cube
复杂文书：Plus
重要文书：Max

案件分析类

单一法律关系：Flash/Cube
多重法律关系：Plus
疑难复杂案件：Max

合同审查类

简单合同：Flash
常规商务合同：Cube
复杂交易合同：Plus
重大交易合同：Max

按行业场景分类

个人用户

日常咨询：Fast Flash / Flash
文书起草：Flash
案件评估：Cube / Plus

企业法务

常规审查：Cube
合同起草：Cube / Plus
风险评估：Plus
重大决策：Max

律所律师

初步检索：Flash / Cube
案件分析：Plus
疑难案件：Max
文书生成：Cube / Plus

学术研究

文献检索：Cube
理论分析：Plus / Max
论文写作：Max

使用建议

1. 合理分配使用

不要所有问题都用最高级模型。建议：

80% 的简单问题用 Fast Flash/Flash
15% 的中等复杂问题用 Cube/Plus
5% 的关键任务用 Max

2. 善用模型切换

在对话过程中可以随时切换模型：

先用 Fast Flash 快速了解概况
再用 Plus/Max 深入分析重点问题

3. 关注模型特性

不同模型有不同的思考配置：

部分模型支持思考模式，可以进行深度推理
部分模型支持高级安全防护，自动标识可能的输出错误

4. 考虑成本效益

高级模型虽然质量好，但消耗也更高：

Max 模型的 token 消耗可能是 Fast Flash 的数倍
合理选择模型可以大幅降低使用成本

提示：如果您不确定该用哪个模型，可以从 Flash 开始，根据回答质量决定是否需要切换到更高级的模型。

​模型概览

​模型列表

​快速响应系列

​专业推理系列

​模型定位详解

​Fast Flash（极速模型）

​Flash（平衡模型）

​Cube（商用模型）

​Plus（专家模型）

​Max（旗舰模型）

​如何选择适合的模型

​根据问题复杂度选择

​根据使用频率选择

​根据会员等级选择

​各模型适用场景总结

​按任务类型分类

​按行业场景分类

​使用建议

​1. 合理分配使用

​2. 善用模型切换

​3. 关注模型特性

​4. 考虑成本效益

模型概览

模型列表

快速响应系列

专业推理系列

模型定位详解

Fast Flash（极速模型）

Flash（平衡模型）

Cube（商用模型）

Plus（专家模型）

Max（旗舰模型）

如何选择适合的模型

根据问题复杂度选择

根据使用频率选择

根据会员等级选择

各模型适用场景总结

按任务类型分类

按行业场景分类

使用建议

1. 合理分配使用

2. 善用模型切换

3. 关注模型特性

4. 考虑成本效益