大语言模型赋能备案审查
业务背景
备案审查是指规范性文件在制定颁布后,按法定期限报同级或上一级人大常委会备案,由接受备案的人大常委会在法定期限内依照法定标准和程序对其进行监督审查的活动。
在这个过程中,最重要的就是确保下位法不会与上位法相抵触。
因规范性文件众多,而具备审查资格的专家又极少,故工作进程较为缓慢,现期望借助AI的能力,提高效率。
核心流程
大约 2 分钟
备案审查是指规范性文件在制定颁布后,按法定期限报同级或上一级人大常委会备案,由接受备案的人大常委会在法定期限内依照法定标准和程序对其进行监督审查的活动。
在这个过程中,最重要的就是确保下位法不会与上位法相抵触。
因规范性文件众多,而具备审查资格的专家又极少,故工作进程较为缓慢,现期望借助AI的能力,提高效率。
对于已知问题有正确答案的场景,适合使用 ragas 的 faithfulness 指标对 GenAI 应用响应结果进行评估,方便进行回归测试。
注意:本文提到的方法,只适用于对已知问题的评估。对于线上运行时,用户提的随机的、不在测试集范围内的问题,不适合用此方法评估。
pip install ragas