在讨论短视频平台算法「推得准」的时候,很多瞎逼分析的人会说:平台给内容打标签,然后推给可能感兴趣的人,所以推荐算法做得很好。
凡是这么简单归因的人,都是不懂的。
和DY、KS这方面的核心负责人交流过,目前在内容分发上基本不依赖标签,而是通过更先进的深度学习。
好处是比你更懂你,坏处是可解释度低。
因为算法追求的是全局最优,所以会有定向干预的需求。但解释度低就不好做定向干预,只要干预,就是负向。
平台给内容打的标签,主要是人用来定义和解释内容的。由于人的理解能力是低于深度学习算法的,不一定能猜对用户喜欢什么。比如一个用户喜欢美女跳舞,是喜欢跳舞还是颜值,很难分辨。
给这样的内容打标签,作用不是为了理解和辅助分发,而是提供了人能理解的工具,也是业务层面能解释的干预窗口,把黑盒问题白盒话,这样各个角色都能理解和获得反馈。
用标签来辅助内容分发,效率肯定是低的,但也不是完全没有价值。在有些算法不准或捕捉不到信号的时候,标签就能派上用场。