hahadsg's note

Follow me on GitHub

metric

p * r

可以使用\(precision * recall\)作为评判标准,同时考虑了\(p, r\)

\(P(Y=1)\)代表真实的正样本比例,但是我们不知道正样本的比例,因为\(U\)数据集中也有\(P\);\(P(f(x)=1)\)代表模型预测的正样本比例,这个是根据模型预测的结果就可以得到的

实践中,我们使用下面的公式来作为\(pr\)的比较

\[\frac{pr}{P(Y=1)} = \frac{r^2}{P(f(x)=1)}\]

由于\(P(Y=1)\)正样本概率是一个固定值,所以作为分母不会影响最后的比较。然后左边可以推导到右边,我们根据右边的公式计算出metric,来比较模型。

$$p = P[Y=1 f(x)=1], r = P[f(x)=1 Y=1]\(代入上式即可完成推导,另外,\)r\(是可以估算的,而\)p$$是无法估算的