模型概览
LawChat 提供多个不同规格的 AI 模型,每个模型针对不同的使用场景进行了优化。您可以根据任务复杂度、响应速度需求和会员等级来选择合适的模型。模型列表
快速响应系列
适合简单问答和日常咨询,响应速度快,适合高频互动。| 模型 | 参数量 | 响应速度 | 会员要求 | 适用场景 |
|---|---|---|---|---|
| Fast Flash | 4B | 140 tokens/s | Free | 快速查询、简单法律咨询、日常问答 |
| Flash | 8B | 80 tokens/s | Free | 文书起草、合同审查、常规法律分析 |
专业推理系列
适合复杂案件分析和专业法律文书生成,推理能力强,回答质量高。| 模型 | 参数量 | 响应速度 | 会员要求 | 适用场景 |
|---|---|---|---|---|
| Cube | 14B | 60 tokens/s | Pro | 企业法务、常规诉讼分析、合同审查 |
| Plus | 32B | 45 tokens/s | Pro | 复杂诉讼策略、重大利益决策、深度法律分析 |
| Max | 200B (MoE) | 30 tokens/s | Max | 疑难案件研判、企业级法律服务、学术研究 |
模型定位详解
Fast Flash(极速模型)
定位:轻量级快速响应 适合场景:- 快速法律条文查询
- 简单法律问题解答
- 日常咨询对话
- 高频率互动场景
- 响应速度最快,几乎实时回复
- 适合处理直接、明确的问题
- 消耗资源最少,性价比高
- “劳动法规定的加班费计算标准是什么?”
- “起诉需要准备哪些材料?”
- “合同生效的基本条件有哪些?“
Flash(平衡模型)
定位:性能与速度的平衡 适合场景:- 日常法律文书起草
- 基础合同审查
- 一般法律咨询
- 批量文档处理
- 速度与质量的平衡点
- 适合大多数日常法律任务
- Free 会员的主力模型
- “帮我起草一份简单的房屋租赁合同”
- “审查这份劳动合同的条款是否合法”
- “写一份离婚协议书”
Cube(商用模型)
定位:主流商用级别 适合场景:- 律所内部助手
- 企业法务常规审查
- 中等复杂度案件分析
- 法律文书标准化生成
- Pro 会员入门级模型
- 处理复杂度适中的法律任务
- 输出质量稳定可靠
- “分析这个劳动争议案件的法律关系”
- “为这家公司起草一份标准的劳动合同模板”
- “审查这份商业合同的潜在风险”
Plus(专家模型)
定位:专家级推理能力 适合场景:- 复杂诉讼策略分析
- 重大利益决策支持
- 深度法律研究
- 多法律关系交叉分析
- 强大的逻辑推理能力
- 能处理复杂案情
- 输出更加严谨和专业
- “这个跨境并购案件涉及哪些法律风险,如何规避?”
- “分析这个知识产权侵权案件的胜诉概率和赔偿金额”
- “为这个复杂的股权纠纷设计诉讼策略”
Max(旗舰模型)
定位:顶级旗舰,接近资深律师水平 适合场景:- 疑难案件研判
- 企业级法律服务
- 学术研究与论文写作
- 重大复杂交易结构设计
- 最强的推理和分析能力
- 深度理解复杂法律关系
- 输出质量接近专业律师
- 支持超长上下文(最高 1M tokens)
- “分析这个涉及多个法律领域的复杂案件,给出全面的法律意见”
- “为这个跨国交易设计完整的法律架构和风险控制方案”
- “深入研究这个法律问题的学术争议和实务处理”
如何选择适合的模型
根据问题复杂度选择
根据使用频率选择
- 高频使用:优先使用 Fast Flash/Flash 处理简单问题,节省额度
- 重要任务:使用 Plus/Max 确保输出质量
- 批量处理:使用 Flash/Cube 平衡效率和质量
根据会员等级选择
| 会员等级 | 可用模型 | 建议 |
|---|---|---|
| Free | Fast Flash, Flash | 日常咨询使用 Fast Flash,重要文书用 Flash |
| Pro | 全部模型(Max 除外) | 常规任务用 Cube,复杂分析用 Plus |
| Max | 全部模型 | 根据任务复杂度灵活选择 |
各模型适用场景总结
按任务类型分类
法律咨询类- 简单咨询:Fast Flash
- 一般咨询:Flash
- 深度咨询:Plus/Max
- 简单文书:Flash
- 标准文书:Cube
- 复杂文书:Plus
- 重要文书:Max
- 单一法律关系:Flash/Cube
- 多重法律关系:Plus
- 疑难复杂案件:Max
- 简单合同:Flash
- 常规商务合同:Cube
- 复杂交易合同:Plus
- 重大交易合同:Max
按行业场景分类
个人用户- 日常咨询:Fast Flash / Flash
- 文书起草:Flash
- 案件评估:Cube / Plus
- 常规审查:Cube
- 合同起草:Cube / Plus
- 风险评估:Plus
- 重大决策:Max
- 初步检索:Flash / Cube
- 案件分析:Plus
- 疑难案件:Max
- 文书生成:Cube / Plus
- 文献检索:Cube
- 理论分析:Plus / Max
- 论文写作:Max
使用建议
1. 合理分配使用
不要所有问题都用最高级模型。建议:- 80% 的简单问题用 Fast Flash/Flash
- 15% 的中等复杂问题用 Cube/Plus
- 5% 的关键任务用 Max
2. 善用模型切换
在对话过程中可以随时切换模型:- 先用 Fast Flash 快速了解概况
- 再用 Plus/Max 深入分析重点问题
3. 关注模型特性
不同模型有不同的思考配置:- 部分模型支持思考模式,可以进行深度推理
- 部分模型支持高级安全防护,自动标识可能的输出错误
4. 考虑成本效益
高级模型虽然质量好,但消耗也更高:- Max 模型的 token 消耗可能是 Fast Flash 的数倍
- 合理选择模型可以大幅降低使用成本
提示:如果您不确定该用哪个模型,可以从 Flash 开始,根据回答质量决定是否需要切换到更高级的模型。