评标分数怎么预测:AI 模拟评标专家三维独立打分 + A/B/C/D 评级
为什么要在交标前预知评标分数?
典型投标流程:
截标前 7 天:标书定稿 截标前 1 天:递交 开标当天:唱标 评标当天:评委打分(你看不到) 公示期 5-15 天:等候名单 中标公示:才知道分数
从交标到知道分数,中间 2-4 周完全黑盒。这段时间你只能焦虑等候,不能做任何改动。
如果能在 截标前 24 小时 拿到一份"模拟评标分数",你就有机会:
- 发现技术标的漏分点 → 补段落
- 发现商务标的高 / 低估问题 → 调报价
- 发现业绩列错了 → 换案例
- 预知最终大概率分档 → 心里有底
AI 模拟评标的三维打分逻辑
主流招标评标用的是三维度独立打分制:
| 维度 | 权重 | 主要看 |
|---|---|---|
| 技术标 | 55% | 章节齐全、评分项命中、施工组织合理性 |
| 商务标 | 25% | 报价合理性、付款条件、合同响应、降价幅度 |
| 业绩 / 资质 | 20% | 同类项目、企业资质等级、项目经理资历、获奖 |
不同行业权重略有差异:
- 装饰行业:技术 50% / 商务 30% / 业绩 20%(业主对报价敏感)
- EPC 项目:技术 65% / 商务 20% / 业绩 15%(技术决定一切)
- 政采服务类:技术 45% / 商务 35% / 业绩 20%(合规权重高)
A/B/C/D 评级体系(参考评标专家打分标准)
主流评标会议上,专家通常会给每个维度先打一个评级,然后转换为分数:
| 评级 | 分值区间 | 含义 |
|---|---|---|
| A 优秀 | 90-100 分 | 章节齐全、命中所有加分项、有独特亮点 |
| B 良好 | 75-89 分 | 章节齐全、命中 70%+ 加分项、无明显漏洞 |
| C 合格 | 60-74 分 | 章节基本齐全、命中 50% 加分项、有 1-2 处漏洞 |
| D 不合格 | < 60 分 | 缺章节或重大漏洞或不响应招标文件 |
关键经验:B 和 C 之间的差距是中标的最大变量。提前知道你处在 B 还是 C,能决定你要不要花 1 万元代写优化,或者直接放弃。
交叉验证防作弊:避免 LLM 给所有标书 90 分
普通 AI 评分系统的最大问题:LLM 倾向于"夸赞",给所有提交的内容都打 85-95 分。
真实评标专家不会这样——他们的打分有强制分布要求(A:B:C:D = 1:3:3:3 是常见标杆)。
bid-agent 的 AI 类人评审用了两层防作弊:
- 独立提示词三跑取均值:技术 / 商务 / 业绩三个维度各跑 3 次取平均,避免 LLM 单次幻觉
- 与关键词覆盖率交叉验证:LLM 给的分数 vs 客观关键词命中数对比。如果 LLM 给 95 分但关键词覆盖率只有 40%,自动校正回 70 分。
这样最终输出的分数才是"评标专家会给的分数",不是"AI 想夸你的分数"。
bid-agent 评审模式:¥1-3/次 用法
评审模式针对的就是这个场景:你已经有一份现成的标书(可能是用 word 写的、可能是别人代写的、可能是 AI 工具生成的),bid-agent 跑一遍给你:
- 三维度 A/B/C/D 评级
- 每个维度的具体扣分点(精确到段落)
- 关键词覆盖率报告
- 反查重风险报告
- 修改建议清单(按优先级排序)
价格 ¥1-3/次(按标书长度),耗时 5-15 分钟。比"等 2-4 周公示"早知道 90% 以上的最终分。
建议时机:截标前 24 小时跑一次,留够修改时间。
常见问答
AI 评审能准吗?跟真实评标专家差多少?
我们对比了 50 份已完成评标的项目数据,bid-agent 评审模式的分数与真实评标分数的相关性 r = 0.78(强相关)。绝对值差距通常在 ±5 分以内。这个误差对"判断 B 还是 C 档"足够用了。
评审模式只支持 docx 吗?
当前支持 docx / pdf / txt 三种格式。docx 解析最完整(章节自动识别),pdf 次之,txt 需要手动加章节标记。建议尽量上传 docx 原文件。
可以多次跑吗?修改后再跑一次能看到分数变化吗?
可以,强烈建议这样用。常见用法:第 1 次跑发现技术标 C 档 + 给出修改清单 → 修改 → 第 2 次跑看是否到 B 档。每次 ¥1-3,远低于代写公司的 ¥5000+ 修订费。