当交响乐团遇上二次元文化,国漫《哪吒之魔童降世》遇上日漫《某科学的超电磁炮》,网络流行“佛系少女”碰撞“钢铁洪流进行曲”,在哔哩哔哩这三个半小时的晚会中,合唱、交响乐、古风、电子乐、rap等音乐形式都在这里奇妙融合,选材精准切中用户的心理,而在这背后离不开大数据和算法的支撑。那么,算法真的有这么神奇,能读懂用户的一切吗?
算法如何“了解”人的内心
随着互联网技术和智能手机的发展,人工智能采集用户数据的能力变得空前强大,拥有这些数据之后,个性化推荐变得容易实现,不论是淘宝京东,还是音乐视频网站,都无疑是这个时代最大的受益者。
90后小林还记得几年前注册哔哩哔哩网站会员时被做题支配的恐惧,100道题涵盖了音乐、影视、动漫和游戏等领域,问题往往也非常无厘头,“人气动画作品魔法少女小圆的导演是谁”“是哪家公司开发了‘上古卷轴’(一款游戏)”。这么做当然不是为了折磨用户,答案的正确与否决定了为用户推送的内容,这种注册信息的筛选为哔哩哔哩早期的内容推荐立下了汗马功劳。无独有偶,豆瓣、QQ音乐等app在注册流程中要求用户标出感兴趣的群组也是基于这个算法。
除了注册信息之外,搜索关键词和浏览购买记录也是算法的主要数据来源。
如果你是一位新注册的买家,想在淘宝买东西,算法在空白数据下会怎么推荐呢?淘宝往往会根据你搜索的关键词来进行跟踪推荐,接着调取此类产品的最大成交量款式推送。例如一条连衣裙,款式繁多,但最近韩款销量最好,那么靠前的推送一定是韩系!
对于淘宝京东这种头部购物app来说,所有的浏览数据都会被记录在案,浏览这一行为的本身就代表了用户对此类商品感兴趣。而一旦在某家店铺购买了商品,“购买过的店铺”标签更是会自动添加,在绝大多数商品中,这种最高级别的推荐是非常靠前的。
用户真的喜欢算法的推送吗
王阿姨最近就有点烦恼,自从前些日子在淘宝买了马桶刷之后,“猜你喜欢”几乎都是此类品商。她坦言,自己并不需要第二把马桶刷,算法这个东西不大灵。
网易云音乐资深用户“海饼干”就表达了不同意见,“我每天都用网易云听日语歌曲和纯音乐,如果没有算法推送的话,我连歌名都搜索不到,更遑论听到同类型歌曲了。”他最喜欢算法的一点就是它能掌握每个人的兴趣爱好,喜欢什么风格就会推同类型的曲子,不用费劲巴拉自己找浪费时间,这不是挺好吗?
不过,既然是算法,就不可能做到完美适配任何人的要求,不少人表示自己可以接受兴趣爱好类别的算法推荐,衣物、鞋子等消耗品也可,但是对几乎不会短时间内再次购买的物品推送多有反感。
算法能否规避“泥石流”
在享受算法带给人们便利的同时,大数据迎合用户心理背后的乱象也不容忽视,每当女艺人出现时,弹幕往往会攻击她身材上的某些缺陷,从众者甚,这类问题在哔哩哔哩乃至许多视频网站上都大量存在,恶趣味“擦边球”言论更是屡见不鲜。如何用算法规避约束这些“泥石流”,正确引导青少年群体的心理健康,这是掌握海量大数据的互联网企业需要慎重考虑的课题。
新民晚报记者 任天宝