其中,N+为正样本总数,N-为负样本总数。如果将TPR和FPR画在一个坐标轴中,随着选取阈值t的不同,TPR和FPR在坐标轴上会形成一条曲线,这条曲线叫ROC曲线。假如模型预估结果是随机的,那么模型对正负样本没有区分度,在y>t的样本中真实的正负样本比例和总样本中正负样本的比例相同,即
此时ROC为一条直线。如果模型区分度很好,预估的所有正样本都比负样本分数高,那么当t变化时,有TPR=1或FPR=0。而真实模型的ROC是一条上凸的曲线,介于上面两种情况之间,如图9.3所示,ROC曲线下的面积即为AUC(Area Under The Curve),AUC常常被作为评估模型好坏的标准。
图9.3 AUC
三.NE
NE(Normalized Entropy)通过如下公式计算:
其中,pi为模型的预估点击率,p为历史数据的统计点击率。NE越小,模型的效果越好。
企业宣传片报价,广告宣传片报价,短视频宣传片报价可以致电咨询我们。
相关资讯
您可能对下面的文章也感兴趣!