欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统独创技术24780字

一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统

2021-03-20 14:50:45

一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统

  技术领域

  本发明涉及移动通信领域,尤其涉及一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统。

  背景技术

  近年来,随着移动互联网以及相关产业的迅猛发展,无线流量呈现爆炸式增长。无线网络需要承载海量数据的传输,回传链路将成为整个网络的瓶颈所在。思科公司最新报告显示,到2022年,全球移动流量预计将达到每月77EB,与2017年相比移动流量增长了7倍,移动数据流量将从2017年到2022年以46%的复合年增长率增长,无线流量需求的快速增长会给当前无线网络带来巨大的压力。以视频文件为例,如图1所示,李凯院士团队根据社交软件FaceBook视频播放情况得出的统计结果显示,前0.1%和1%的视频分别占据了62%和83%的总视频观看时间。因此,如果能够把最具有缓存价值的文件放在蜂窝移动网络的边缘节点,这样就能极大地缓解核心网的回程链路压力。

  同时,报告还显示到2022年,全球将会有57亿移动用户,巨大数量的移动设备和日渐成熟的D2D通信技术使D2D边缘缓存技术成为了热门研究方向。近年来,边缘缓存的研究工作大多都假设所有用户具有相同的个人偏好,且设计缓存策略时较少考虑用户偏好之间存在差异性。但在实际场景中,用户偏好存在明显的差异性。例如,不同的用户喜欢的电影类型不同,且具有时变性。如图2所示,对于MovieLens数据集中一部名叫“ToyStory”电影而言,可以看出,不同年龄段的用户对同一部电影的喜好程度存在明显的差异性。因此,设计更为实际的缓存策略需要考虑用户偏好之间存在的差异性。

  目前学术界已经有工作考虑用户偏好差异对缓存机制设计的影响。北航的杨晨阳教授提出了一种pLSA(Probabilistic latent semantic analysis,概率隐性语义分析)模型对用户偏好进行建模,通过最大期望法得到用户偏好的模型参数,通过统计的方法可以较快速得到用户偏好模型,但模型参数一旦得到便不会发生改变,也即是认为一个人的个人喜好是固定的,这种假设是较为理想的。

  发明内容

  本发明针对时变用户偏好需求,提出了一种联合考虑用户偏好及用户活跃程度的移动边缘缓存的方法,致力于提高D2D缓存命中率和降低基站的回程流量压力。

  本发明提供了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法,包括如下步骤:

  步骤S1,内容交付步骤:在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;

  步骤S2,信息交换步骤:判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)=wt(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;

  步骤S3,内容放置步骤包括如下步骤:

  步骤S31,活跃程度预测步骤:uk首先预测在下一个时间周期内所有邻居用户的活跃程度;

  步骤S32,判断步骤:判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播步骤;如果下一下时间周期内周围不存在活跃用户,那么执行广播步骤;

  步骤S33,广播步骤:uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。

  作为本发明的进一步改进,在所述步骤S2,信息交换步骤中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),

  

  在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。

  作为本发明的进一步改进,在所述步骤S31,活跃程度预测步骤中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。

  作为本发明的进一步改进,在所述步骤S31,活跃程度预测步骤中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1为

  

  其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。

  作为本发明的进一步改进,在所述步骤S3,内容放置步骤中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为

  

  uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。

  本发明还提供了一种联合考虑用户偏好及活跃程度的移动边缘缓存的系统,包括:

  内容交付模块:用于在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;

  信息交换模块:用于判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;

  内容放置模块包括:

  活跃程度预测模块:用于uk首先预测在下一个时间周期内所有邻居用户的活跃程度;

  判断模块:用于判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播模块;如果下一下时间周期内周围不存在活跃用户,那么执行广播模块;

  广播模块:用于uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。

  作为本发明的进一步改进,在所述信息交换模块中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),

  

  在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。

  作为本发明的进一步改进,在所述活跃程度预测模块中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。

  作为本发明的进一步改进,在所述活跃程度预测模块中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1为

  

  其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。

  作为本发明的进一步改进,在所述内容放置模块中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为

  

  uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。

  本发明的有益效果是:本发明所设计的缓存系统减少了传统D2D缓存系统对中心基站或者云端控制器的依赖,联合考虑用户偏好及活跃程度对区域内容流行度的影响,依靠设备之间有限的信息交换就可以及时捕捉到区域内流行度较高的文件,算法复杂度较低易实现。所提出的缓存方法由于采用了滑动窗口法预测用户在下一个时间周期的活跃程度,在缓存放置阶段每个用户可以根据预测结果和活跃用户的用户偏好进行更精准的内容放置,从而可以有效提高D2D缓存命中率。另外,如果预测结果表明下一个时间周期内某个用户周围没有活跃用户,该用户可以跳过缓存放置阶段,进而可以减少缓存更新对基站产生的流量负载。

  附图说明

  图1是视频播放量与视频流行度排名的关系图;

  图2是电影评分高低与用户年龄段的关系图;

  图3为分布式D2D边缘缓存模型图;

  图4为时间周期的划分图;

  图5为缓存方案设计流程图;

  图6滑动窗口法预测用户活跃程度图。

  具体实施方式

  本发明公开了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统,下面进行详细说明。

  一.系统模型

  如图3所示,小区内有一个中心基站和K个均匀分布的智能终端用户,用户集合为U={u1,u2,...,uK},所有用户既可以与基站进行蜂窝通信,也能进行D2D通信以此实现数据共享。时间被划分为T个时间周期,即t=1,2,...,T,其中每个时间周期大小相同和T足够大。为了便于干扰管理,假设所有用户能够进行D2D通信的最大距离为RD,则在第t个时间周期内能与用户uk进行D2D通信的用户集合为um∈Uk,t={um∈U|||um-uk||≤RD},同时假设D2D通信采用正交频率以避免同信道干扰。

  在不失一般性的前提下,本发明考虑一个静态文件库并假设每个文件的大小相同。此外,每个文件f都有一个属于自身的N维静态特征向量x(f)={xf,1,xf,2,...,xf,N}T,x(f)∈RN。以电影文件为例,文件特征向量可能包括电影类型,电影的历史平均得分,历史观看人数和首映年份等。相应地,每个用户也有一个属于自己的用户偏好向量wt(k)={wk,t,1,wk,t,N,…,wk,t,N},wk,t,i∈R,1≤i≤N,且用户偏好向量是动态时变的。为了更完整地描述该系统,下面给出了三个描述请求信息的三个变量:

  1)pk,f,t:pk,f,t∈[0,1]是指用户uk在第t个时间周期内对文件f的偏好程度,pk,f,t的值越大代表uk越喜欢文件f;

  2)λk,m,t:λk,m,t∈[0,1]是指用户uk对用户um预测的用户活跃程度;

  3)pk,t:pk,t是指所有文件在用户uk处的区域流行度,pk,t=[pk,t(1),pk,t(2),…,pk,t(F)],并且

  如图4所示,每个时间周期包含3个阶段:内容交付阶段、信息交换阶段和内容放置阶段。内容交付阶段发生在每个时间周期的开始,每个用户根据自己的用户偏好独立的发出文件请求。假设Q=[Q1,Q2,...,QK]代表所有用户的文件请求矩阵,其中Qk=[Qk,1,Qk,2,...,Qk,T],k∈[1,K]是用户uk的文件请求向量,Qk,t代表uk在第t个时间周期内请求文件的总次数。当用户uk∈U在第t个时间周期内请求文件f时,用户会首先检查自身缓存空间内是否缓存了文件f;如果自身没有缓存文件f,uk会向周围用户um∈Uk,t发出文件请求,周围一跳范围内空闲的用户如果缓存f时会产生应答,然后二者建立D2D通信链路实现内容共享;如果uk自身和周围用户Uk,t都没有缓存f,uk将会向中心基站发出请求并通过核心网获得文件f。在信息交换阶段,每个用户会把更新后的用户偏好向量和请求向量广播给周围邻居用户,这些信息会被用来预测区域内容流行度。接下来,在内容放置阶段,每个用户根据预测的区域内容流行度放置或更新缓存文件。最后,每个用户在放置完缓存文件后会把自身的缓存状态告诉周围邻居用户。

  二.问题建模

  如果用户通过D2D通信获取内容,用户将会以较低时延满足请求,则用户体验质量更高。因此,本发明以平均D2D缓存命中率作为系统优化目标。为了更好的表示首先介绍如下指示变量:

  1)qk,f,t:qk,f,t=1表示用户uk在第t个时间周期请求了文件f,则表示未请求;

  2)ak,m,t:ak,m,t=1代表用户uk和用户um在第t个时间周期可以建立D2D通信链路,ak,m,t=0则代表不可以;

  3)ck,m,t:ck,m,t=1代表用户uk在第t个时间周期内缓存了文件f,ck,m,t=0则代表未缓存;

  4)lk,f,t:lk,f,t=1代表用户uk在第t个时间周期内可以通过D2D通信的方式获得文件f,lk,f,t=0则代表不可以。

  由于lk,f,t的值取决于用户uk和其周围邻居用户在第t个时间周期内是否缓存有文件f,因此lk,f,t可以被表示为

  

  进一步地,平均D2D缓存命中率可以被表示为

  

  最后,缓存优化问题可以被构造为

  

  本发明目的是通过在有限缓存空间的限制下最大化平均D2D缓存命中率来找到最佳的分布式D2D缓存策略。

  三.解决方案

  为了最大化平均D2D缓存命中率本发明提出了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法,详细流程如图5所示。

  本发明的一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法包括:

  步骤S1,内容交付步骤:在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,即给出的标签,同时,uk还会记录自身在当前时间周期内请求文件的总次数(即,更新文件请求向量)。

  步骤S2,信息交换步骤:判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户。

  步骤S3,内容放置步骤包括如下步骤:

  步骤S31,活跃程度预测步骤:uk首先预测在下一个时间周期内所有邻居用户的活跃程度;

  步骤S32,判断步骤:判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容(例如,缓存流行度较大的前5个文件),然后执行广播步骤;如果下一下时间周期内周围不存在活跃用户,那么执行广播步骤;

  步骤S33,广播步骤:uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。

  在步骤S2,信息交换步骤中,本发明提出一种基于监督逻辑回归算法来学习用户偏好。为了表示用户对某一文件是否喜欢,采用yk,f作为用户uk∈U是否喜欢文件f的指示变量,其中yk,f=1代表用户uk∈U喜欢文件f和yk,f=0代表不喜欢。通常而言,用户会请求自己喜欢的文件,因此预测一个用户是否会请求某一文件这个问题可以转换为预测该用户是否喜欢该文件。采用S型函数(Sigmoid function)来表示用户偏好向量与文件特征向量之间的关系:

  

  其中,pk,f,t∈[0,1]。

  为了衡量用户偏好向量学习的准确性,采用逻辑回归的代价函数J(wk,t)

  

  其中,Qk,t是用户uk在第t个时间周期内请求文件的总次数。

  易知,式(5)是一个凸函数,因此可以通过寻找能够使代价函数J(wt(k))最小的wt(k)进行用户偏好向量的更新,即

  

  对于式(6)采用梯度下降法解决该优化问题,因此wt+1(k)为

  wt+1(k)=wt(k)-αΔwt(k) (7)

  其中,α是迭代学习率和Δwt(k)为

  

  其中,

  综上,用户uk可以通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),如式(9)所示

  

  在步骤S31,活跃程度预测步骤中,采用滑动窗口法预测用户活跃程度,如图6所示。一般而言,用户在某个时间周期内的活跃程度与该用户在当前时间周期内请求文件的次数有关,请求文件的次数越多,用户活跃程度越大。而且,用户的活跃状态将会持续一段时间,我们可以根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。

  根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1为

  

  其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足

  值得注意的是,当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。

  在步骤S3,内容放置步骤中,在缓存放置阶段,每个用户uk首先预测周围用户的活跃程度。如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度。如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余。因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为

  

  uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。

  综上,在本发明中,首先需要构造文件特征向量。通常需要对原始文件信息进行预处理,预处理主要是对文件信息进行归一化处理,得到文件库中每个文件的特征向量x(f),其中x(f)={xf,1,xf,2,…,xf,N}T,x(f)∈RN,即x(f)是描述文件f的N维向量。

  然后学习用户偏好向量。用户偏好向量需要通过训练用户的历史请求数据得到,本发明中采用有监督逻辑回归学习用户偏好。实际场景中,用户的偏好会随时间发生变化,为了更好的表示这种变化,把时间划分为T个时间周期,即t=1,2,...,T,其中每个时间周期大小相同且T足够大。与文件特征向量相对应,用户偏好向量也是N维向量,但用户偏好具有时变性,例如用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。在第t个时间周期内,每个用户请求的文件可以被划分为喜欢或者不喜欢两种类型,而这可以认为是用户赋予文件f的标签yk,f。一般来说,用户通常会请求喜欢的文件类型。因此可以把用户是否会请求某个特定文件f建模为一个二分类问题,使用有监督的逻辑回归模型来学习用户偏好。用户请求过的文件f的特征向量x(f)和标签yk,f会被记录下来,用来更新用户偏好向量,从而及时地捕捉到用户偏好的变化。

  再者,预测用户在下一个时间周期的活跃程度。以视频文件为例,用户往往会集中在一天当中的某一个时间段或者几个时间段请求视频文件,因此可以认为用户的会在连续的一些时间周期内都处于活跃状态,因此本发明采用滑动窗口法来对下一周期用户活跃程度进行预测。

  最后,分别规定内容共享,信息交换和内容放置的方式。本发明把每个时间周期分为三个阶段:内容传递阶段,信息交换和内容放置阶段。在内容传递阶段,当用户uk∈U在第t个时间周期内请求文件f时,用户会首先检查自身缓存空间内是否缓存了文件f;如果自身没有缓存文件f,uk会向周围用户um∈Uk,t发出文件请求,周围一跳范围内空闲的用户如果缓存f时会产生应答,然后二者建立D2D通信链路实现内容共享;如果uk及其周围用户都没有缓存f,uk通过基站获取文件f。同时,用户都会记录自己在当前时间周期内的请求文件的次数Qk,t并储存在请求向量Qk中。在信息传递阶段,用户uk会将请求向量Qk和更新后的用户偏好向量wt+1(k)广播给周围用户。在内容放置阶段,uk会根据自身和周围用户的请求向量利用滑动窗口法预测用户活跃程度,如果预测结果显示在下一个时间周期内有活跃用户,uk将根据预测的用户活跃程度和接收到的用户偏好实时预测内容流行度,最后按照内容流行度大小和周围用户um∈Uk,t已经缓存的文件来更新自身的缓存内容,并且把已经缓存的文件编号广播给周围用户,避免区域缓存内容产生冗余。

  本发明关键技术点在于:(1)提出了一种分布式D2D缓存方法及系统,从用户偏好和用户活跃程度两个角度去预测用户需求,然后根据预测的用户需求指导缓存内容放置;(2)首次使用滑动时间窗口法实时预测用户活跃程度;(3)综合考虑了用户偏好和用户活跃程度对实时文件流行度的影响,根据区域实时内容流行度用户之间进行协作缓存。

  本发明的有益效果如下:

  1.本发明提出的分布式D2D缓存系统可以在没有基站参与的情况下通过用户之间的信息交换分布式完成对实时文件流行度的预测,减少了对基站或者云端控制器的依赖。

  2.采用滑动时间窗口法预测用户活跃程度,结合采用逻辑回归来用户偏好,可以得到实时区域文件流行度,根据实时文件流行度更新缓存内容可以保证较高的D2D缓存命中率。除此之外,用户还可以根据用户活跃程度的预测结果决定是否更新缓存,从而避免了无效果的缓存更新和大大降低了更新缓存对基站产生的负载。

  3.在更新缓存内容时,用户会综合考虑实时内容流行度和周围用户已缓存的内容进行更新自身缓存,避免缓存冗余,进一步提高D2D缓存命中率。

  以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

《一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)