今日头条的引擎是怎么样工作的?
副标题[/!--empirenews.page--]
把媒体内容分发给用户,“你关心的才是头条”,对于今日头条这个产品,相信大家都不陌生。那么,你是否好奇过,今日头条是如何做到,向每个读者推送不一样的、据称是符合读者每个人不同兴趣的内容的呢?今日头条算数中心执行总监刘志毅在日前于深圳北京大学汇丰商学院举行的“数据之美”论坛上做了介绍。 首先,数据从哪里来?虽然对于头条来讲,其用户量、用户的粘性时间已经足够大了,但是,要怎么样精细,怎么样的数据才是可信赖的,怎么样的数据是可复用的? 对于数据所产生和获取的流程,今日头条算数中心执行总监刘志毅抛出一道小问题来介绍:
事实上,按正常的逻辑确实应该回答“第一个”的,“但是在互联网公司,答案是第二个,因为虽然是一颗一颗地数,但他一秒种可以数一万个,所以他更直接更快速。”这是机器学习发展到今天的成果,机器分发的效率一定大于人工分发。在 2016 年的年终,易观发布的第三方数据显示,如今机器分发的比例已经超过了人工分发。 分发糖果与分发内容逻辑是一样的。那么,这背后,头条具体的引擎是怎么样工作的?这时候需要把文章和用户两端的数据连接起来。 据刘志毅解释,
“然后我们去看这两个向量,怎么样匹配度最高,然后就推送给他。” 具体来说,这些用以匹配的数据变量可能包括几个大方面的特征:
这些数据将产生一个百亿级别的特征,今日头条最终根据特征判断用户的需求,把内容呈现到每一个人不同的手机屏幕上。 但是,这还不是最技术范的地方。数据部门真正做的事情是,“从刚刚所描述的这个过程中积累出来一些东西,然后让他去发挥价值,”刘志毅说道,这才是数据挖掘的价值所在。 “这只是我所想要表达的数据维度的1%,”
刘志毅称,“这样的信息都会作为这个用户的组合特征的一部分,然后我们去提取这一部分来把它作为数据的样本进行分析。” (编辑:淮北站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |