你好,我在代码里发现评估效果这部分的代码封装得比较好,很难调试看到内部的信息是怎么算的,特别是SpanFPreRecMetric中的各项指标的计算,我想知道这个基于span是什么意思,他跟普通的f,pre,rec有什么不一样嘛