为什么你的手机喜欢偷偷收集你的个人信息?
首先要知道,社交网站、购物网站包括你使用的苹果、安卓手机,是没有权限窃听你的电话或者盗取你的搜索资料的,只是你的行为数据让你的手机意识到了你具体想要什么。
再例如,你注册一个账号,需要输入自己的名字;手机号;性别;所在地;这些是微不足道的基础数据。
当然还有你的消费记录;打车频率;浏览的公众号类型;玩过的游戏...这些行为最后统统会变成几千个事实标签,成为你行为数据的一环节。
采集标签的目的,就是为了构建用户画像,从杂乱的标签当中,最终模拟一个和你兴趣、爱好、思想相近的“你”。
例如,你玩手机看到一篇内容标签为“美女”的文章,而这并不表明你真的喜欢美女,也可能是手滑点的。因此,手机判断你的兴趣喜好还要根据浏览的停留时间、搜索次数、是否评论转发等等。
当然,这关系到一个初级的内容标签权重算法:
兴趣标签( 美女 )权重 = 行为权重 x 访问时长 x 衰减因子
行为权重:什么都不干 1 分,评论 + 0.5,点赞 + 0.5,转发 + 2,收藏 + 1
时长权重:10S 以内权重为 0.5,10S-60S 为 1,60S 以上为 2
衰减因子:0 - 3 天内权重为 1,3 - 7 天权重为 0.85,7 - 15 天权重为 0.7,15 - 30 天权重为 0.5,30 天以上权重为 0.1
兴趣标签权重和你的阅读时长、评论、点赞、转发收藏有着密切关系,并且不同操作有着不同的加分数值,最终累积成行为权重。
这点有点类似网易云在私人FM为你推荐的歌曲类似。停留时间越长,时间权重也随之越高。
你经常浏览美女,评论关于美女的文章,看关于美女的视频,手机会将你一段时间内所有关于美女的兴趣权重累加,再以S形函数标准化,最终得到一个从0到10的兴趣标签值。
这个数值越高,你就对含有美女的内容越感兴趣。
不仅仅局限于内容兴趣,这种算法还能够根据你的消费能力、消费兴趣、社交习惯等多个维度建立用户画像,并计算你的喜好。
之后,这些喜好会被转换成特征向量,比如你的美女兴趣标签值是8,消费能力是5,社交偏好是2,那么向量表示为r(8,5,2)。
我们可以将特征向量想象成一个多维空间的一个坐标点,通过每个用户的向量坐标去带入余弦公式或距离公式中,就能计算出和你相似的人,进而把用户分类。这是一个大工程。
但是行为数据只能计算出你的喜好,而无法判断出你的性别、学历等深入的个人属性。
这需要将已知性别和学历的用户作为样本,一些用来训练模型,一些用来测试精准度。现如今,各大平台对于用户性别的预测准确度达到90%以上。
因此,你的手机就能够得到大致这样一个用户画像,它包含了你的各项兴趣权重。
手机通过收集用户的数据来监控用户的喜好。以下是一些例子:
1. 搜索历史:手机会记录用户的搜索历史,包括搜索的关键词和频率。通过分析用户的搜索历史,手机可以推断出用户感兴趣的主题、领域和品牌,从而推荐相关的内容和广告。
2. 应用使用记录:手机可以记录用户使用各个应用的频率、时长和位置等信息。通过分析用户的应用使用记录,手机可以了解用户的兴趣和行为习惯,进而推荐更符合用户喜好的应用和服务。
3. 社交媒体:手机可以监控用户在社交媒体上的行为,如点赞、评论、分享等,从而了解用户感兴趣的内容和话题,以便向用户推荐相关的内容和广告。
4. 音乐和视频:手机可以监控用户在音乐和视频流媒体平台上的听歌和观看记录,从而推荐更符合用户喜好的音乐和电影。
5. 位置数据:手机可以记录用户的位置信息,包括家庭地址、工作地址、出行路线等。通过分析用户的位置数据,手机可以推断出用户的生活习惯和兴趣爱好,进而向用户推荐相关的服务和广告。总之,手机通过收集用户的数据,包括搜索历史、应用使用记录、社交媒体、音乐和视频、位置数据等信息来监控用户的喜好。这些数据可以帮助手机向用户提供更加个性化、符合用户喜好的内容和服务。