导读:很多朋友问到关于物联网中ctr模型是什么的相关问题,本文首席CTO笔记就来为大家做个详细解答,供大家参考,希望对大家有所帮助!一起来看看吧!
什么是CTR?
什么是CTR?
CTR是“Cycle Time Reduction”缩写,是通过省略不必要的工作步骤来缩短业务流程或产品设计的循环时间,从而使公司能对客户需求做出快速反应持续实施的系统 方法。
(1987年,摩托罗拉首先引入CTR作为获取总体客户满意程度的重要措施之一。自2002年初,CTR活动项目已在APP印尼和中国许多厂展开,APP中国采购CTR活动就 是其中之一。)
采购CTR的循环时间是指:从采购需求计划开始至收料付款的整个业务流程完成所需要的时间。通常CTR项目的实施过程可分为以下四个阶段:
现行阶段(As Is):我们要完全了解当前的业务流程以及有关各方面在日常工作中所遇到的问题和困难,通过脑力激荡与其他相关办法找出问题点。
应该阶段(Should Be):通过脑力激荡找出克服和解决上一阶段所提出各项问题点的改善办法。
实施阶段(Implementation): 实施上阶段所规划出的改善措施。
追踪阶段(Monitoring): 在贯彻实施各项改善措施后,对各项改善方法和实施结果进行评估与监督。
模型评价指标(CTR)
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。
之前的文章没有对评价指标进行一个梳理,此小结补充一下建模过程中一些常用的评价指标。
最近项目在做点击率预估(CTR)建模,建模过程中一直使用AUC作为评估指标。由于我数据集的正负样本是 不均衡的 (1:3), 为了加强模型对正样本的关注度 ,在损失函数中增加了类别权重(类似facal loss, 不了解可以看之前的facal loss介绍),训练完成后发现AUC基本没变化,按以往竞赛经验来看,一般会有提升。然后对模型的精准率(precision)、召回率(recall)也进行输出,发现正样本的精准率确实提升了,但是召回下降了,而AUC整体却没什么变化。
我开始犹豫使用AUC是否真的适合,觉得它不能反映模型对正样本识别能力,而是反映模型整体正负样本排序能力。对于广告点击率预告场景来说,按我对业务的理解,理想情况希望得到这样的模型:它识别出来的正样本用户一定会点击,不希望识别出用户不点击的样本,还有多少正样本没有识别出来就无所谓了,反正保证识别的正样本一定会点击,换句话说,也就是正样本精准率一定要高的前提下,召回仅可能的高(理解有误感谢指出)。
说了这么多, 个人觉得除了通过AUC关注模型的排序能力,是不是也应该多关注模型对正样本的识别能力 。顺便整理一下常用的评价指标。
通过网上常用的混淆矩阵来介绍各种评价指标以及计算公式,从公式中可以看出不同指标更加关注的是什么。
真正例(True Positive, TP):真实类别为正例,预测类别为正例;
假负例(False Negative, FN):真实类别为正例,预测类别为负例;
假正例(False Positive, FP):真实类别为负例,预测类别为正例 ;
真负例(True Negative, TN):真实类别为负例,预测类别为负例;
计算公式:(TP+TN)/(TP+FN+FP+TN)
定义:所有分类正确的样本在所有样本中的占比
样本分布不均衡容易使模型的“满足”,例如正样本占比5%,负样本占比95%,若模型全部预测负样本,准确率为95%。准确率在实际中使用较少。
计算公式:TP / TP+FP
定义:所有被模型预测为正样本中真正的正样本占比
准确率与精准率容易混淆,从公式上看到明显区别。精准率常结合召回率一起观察模型。(下班)
ctr模型跑小数据可以大数据不行
运行内存不够。CTR,Click-Through-Rate,也就是点击率预估,指的是精排层的排序。所以CTR模型的候选排序集一般是千级数量。ctr的运行都是有运行内存的,如果超过了运行内存的运行范围,就无法正常运行,所以小数据可以正常运行,大数据无法正常运行。
结语:以上就是首席CTO笔记为大家整理的关于物联网中ctr模型是什么的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~