手机怎么知道我搜索过什么
展开全部
首先要知道,社 交网 站、购物网 站包括你使用的苹 果、安 卓手机,是没有权 限窃 听你的电话或者盗 取你的搜 索资料的,只是你的行为数据让你的手机意识到了你具体想要什么。
再例如,你注 册一个账号,需要输入自己的名字;手机号;性 别;所在地;这些是微不足道的基础数据。
当然还有你的消费记录;打 车频率;浏 览的公 众号类型;玩过的游戏...这些行为最后统统会变成几千个事实标 签,成为你行为数 据的一环节。
采集标签的目的,就是为了构 建用户画 像,从杂 乱的标签当中,最终模 拟一个和你兴趣、爱好、思想相近的“你”。
例如,你玩手机看到一篇内容标签为“美 女”的文章,而这并不表明你真的喜欢美 女,也可能是手 滑点的。因此,手机判 断你的兴趣喜好还要根据浏 览的停 留时间、搜 索次数、是否评 论转 发等等。
当然,这关系到一个初级的内容标签 权 重算法:
兴趣标签( 美 女 )权 重 = 行为权 重 x 访问时长 x 衰 减因子
行为权 重:什么都不干 1 分,评 论 + 0.5,点 赞 + 0.5,转 发 + 2,收 藏 + 1
时长权 重:10S 以内权重为 0.5,10S-60S 为 1,60S 以上为 2
衰 减因子:0 - 3 天内权 重为 1,3 - 7 天权 重为 0.85,7 - 15 天权 重为 0.7,15 - 30 天权 重为 0.5,30 天以上权 重为 0.1。
兴趣标签权 重和你的阅读时长、评 论、点 赞、转 发收 藏有着密 切关系,并且不同操作有着不同的加分数值,最终累 积成行为权 重。
这点有点类 似网 易 云在私 人FM为你推 荐的歌曲类 似。停留时间越长,时间权 重也随之越高。
你经常浏 览美 女,评 论关于美 女的文章,看关于美 女的视频,手机会将你一段时间内所有关于美 女的兴趣权 重累 加,再以S形函数标准化,最终得到一个从0到10的兴趣标签值。
这个数值越高,你就对含有美 女的内容越感兴趣。
不仅仅局 限于内容兴趣,这种算 法还能够根据你的消费能力、消费兴趣、社交习惯等多个维 度建立用 户画 像,并计算你的喜好。
之后,这些喜好会被转换成特 征向 量,比如你的美 女兴趣标签值是8,消费能力是5,社 交偏 好是2,那么向量表示为r(8,5,2)。
我们可以将特 征向 量想象成一个多 维空 间的一个坐 标点,通过每个用户的向 量坐标去带入余 弦公式或距离公式中,就能计算出和你相 似的人,进而把用 户分类。这是一个大工程。
但是行为数 据只能计算出你的喜好,而无法判 断出你的性 别、学历等深入的个 人属 性。
这需要将已知性 别和学 历的用户作为样 本,一些用来训练模 型,一些用来测 试精 准 度。现如今,各大平 台对于用户性 别的预 测准 确 度达到90%以上。
因此,你的手机就能够得到大致这样一个用户画 像,它包含了你的各项兴趣权 重:
所以说,A P P根 据这个画 像,便根据类 似的广告信息,找到对应的消费 者。
再例如,你注 册一个账号,需要输入自己的名字;手机号;性 别;所在地;这些是微不足道的基础数据。
当然还有你的消费记录;打 车频率;浏 览的公 众号类型;玩过的游戏...这些行为最后统统会变成几千个事实标 签,成为你行为数 据的一环节。
采集标签的目的,就是为了构 建用户画 像,从杂 乱的标签当中,最终模 拟一个和你兴趣、爱好、思想相近的“你”。
例如,你玩手机看到一篇内容标签为“美 女”的文章,而这并不表明你真的喜欢美 女,也可能是手 滑点的。因此,手机判 断你的兴趣喜好还要根据浏 览的停 留时间、搜 索次数、是否评 论转 发等等。
当然,这关系到一个初级的内容标签 权 重算法:
兴趣标签( 美 女 )权 重 = 行为权 重 x 访问时长 x 衰 减因子
行为权 重:什么都不干 1 分,评 论 + 0.5,点 赞 + 0.5,转 发 + 2,收 藏 + 1
时长权 重:10S 以内权重为 0.5,10S-60S 为 1,60S 以上为 2
衰 减因子:0 - 3 天内权 重为 1,3 - 7 天权 重为 0.85,7 - 15 天权 重为 0.7,15 - 30 天权 重为 0.5,30 天以上权 重为 0.1。
兴趣标签权 重和你的阅读时长、评 论、点 赞、转 发收 藏有着密 切关系,并且不同操作有着不同的加分数值,最终累 积成行为权 重。
这点有点类 似网 易 云在私 人FM为你推 荐的歌曲类 似。停留时间越长,时间权 重也随之越高。
你经常浏 览美 女,评 论关于美 女的文章,看关于美 女的视频,手机会将你一段时间内所有关于美 女的兴趣权 重累 加,再以S形函数标准化,最终得到一个从0到10的兴趣标签值。
这个数值越高,你就对含有美 女的内容越感兴趣。
不仅仅局 限于内容兴趣,这种算 法还能够根据你的消费能力、消费兴趣、社交习惯等多个维 度建立用 户画 像,并计算你的喜好。
之后,这些喜好会被转换成特 征向 量,比如你的美 女兴趣标签值是8,消费能力是5,社 交偏 好是2,那么向量表示为r(8,5,2)。
我们可以将特 征向 量想象成一个多 维空 间的一个坐 标点,通过每个用户的向 量坐标去带入余 弦公式或距离公式中,就能计算出和你相 似的人,进而把用 户分类。这是一个大工程。
但是行为数 据只能计算出你的喜好,而无法判 断出你的性 别、学历等深入的个 人属 性。
这需要将已知性 别和学 历的用户作为样 本,一些用来训练模 型,一些用来测 试精 准 度。现如今,各大平 台对于用户性 别的预 测准 确 度达到90%以上。
因此,你的手机就能够得到大致这样一个用户画 像,它包含了你的各项兴趣权 重:
所以说,A P P根 据这个画 像,便根据类 似的广告信息,找到对应的消费 者。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询