D2D网络中基于博弈论的时隙分享合作策略研究-AET-电子技术应用

D2D网络中基于博弈论的时隙分享合作策略研究

2018年电子技术应用第6期

张闯1，邵坦2，王慧武1

1.哈尔滨电工仪表研究所有限公司，黑龙江哈尔滨150028；2.河南许继仪表有限公司，河南许昌461000

摘要： 为了使D2D网络中从属于不同用户的终端进行合作通信，提出了一种基于博弈论的时隙分享合作策略。首先，使互为中继的终端通过分享时隙的方式建立合作；其次，采用博弈论中的纳什谈判方法对终端时隙分享问题进行分析，并通过拉格朗日乘数法求得终端以多大时隙中继彼此数据，解决了终端如何合作的问题；最后，给出了终端合作的截止条件，解决了终端何时合作的问题。仿真实验表明，与直传方式相比，终端采用合作传输策略能够有效地提升能量效率。

关键词： D2D网络时隙分享博弈论纳什谈判

中图分类号： TN915.9；TP393.01
文献标识码： A
DOI：10.16157/j.issn.0258-7998.174033
中文引用格式： 张闯，邵坦，王慧武. D2D网络中基于博弈论的时隙分享合作策略研究[J].电子技术应用，2018，44(6)：80-84.
英文引用格式： Zhang Chuang，Shao Tan，Wang Huiwu. A time slot sharing cooperation strategy based on game theory in D2D networks[J]. Application of Electronic Technique，2018，44(6)：80-84.

A time slot sharing cooperation strategy based on game theory in D2D networks

Zhang Chuang1，Shao Tan2，Wang Huiwu1

1.Harbin Research Institute of Electrical Instruments Co.，Ltd.，Harbin 150028，China； 2.Henan XJ Instrument Co.，Ltd.，Xuchang 461000，China

Abstract： In order to promote the devices belonging to different users to participate in cooperative communication in D2D networks, a time slot sharing cooperation strategy based on game theory is proposed. At first, the cooperative communication between devices which help each other to relay data is established based on sharing time slots. Secondly, the time slot sharing problem is analyzed by using Nash bargaining method of game theory. Meanwhile, the length of time slot which is used to relay the other devices is obtained by adopting Lagrange multiplier method. Thus, the problem that the devices how to cooperate is solved. Finally, the cut-off conditions of devices cooperation is derived, and the problem that devices when to cooperate is solved. Simulation results show that，compared with the direct transmission mode, the proposed strategy can improve energy efficiency of the devices effectively.

Key words : D2D networks；time slot sharing；game theory；Nash bargaining

0 引言

终端直通（Device to Device，D2D）技术通过距离较近的两个设备之间直接进行数据传输，能够带来信道增益、跳数增益、复用增益等好处，从而达到减轻网络业务负载、降低移动终端能耗、提升移动终端电池寿命以及提升系统频谱效率的目的^[1-2]。因此，D2D通信技术被广泛认为是5G通信系统的关键技术之一^[3]。

目前，关于D2D通信技术的研究主要集中在D2D通信邻居节点发现机制、D2D通信会话建立、D2D通信干扰协调及D2D通信传输模式选择等方面^[4-5]。但这些研究大多是在终端自愿合作的前提下进行的，当终端从属于不同的用户，用户为了节省终端的通信资源往往表现出“自私”的特性而不进行合作。为了促使网络中的“自私”节点进行合作，激励“自私”节点合作的机制研究受到了广泛关注。文献[6]针对一个节点互为中继的网络模型，提出了一种基于交换带宽资源的激励合作机制，作者通过合作博弈理论解决了两个节点相互合作时以多大带宽中继对方数据问题。文献[7]在文献[6]的基础上，提出了一种新的基于Kalai-Smorodinsky谈判解的激励合作方法。文献[8]采用合作博弈理论解决了两个对等用户采用交换功率资源进行合作时，以多大功率转发彼此数据的问题。文献[9]针对一个双向协作通信网络，提出了一种基于Stackelberg博弈的共享功率资源的合作算法。文献[10]采用博弈理论解决了在两种不同网络模型下“自私”节点的时隙和功率共享问题。

在上述文献中，文献[6-7]通过交换带宽资源在节点之间建立合作关系，但现在通信系统中频率资源已非常稀缺，因此，本文采用时隙分享的方式在终端之间建立合作。文献[8-10]未考虑数据传输中的能量效率问题。通过以上分析，本文在D2D网络中提出一种新的基于时隙分享的合作策略，解决了终端以多少时隙中继对方数据的问题，并最终达到提升终端能量效率的目的。

1 系统模型

图1为一对称D2D协作通信系统。系统中，终端T₁传输数据至D₃，终端T₂传输数据至D₄。如果系统为蜂窝无线网络，T₁和T₂代表手机或移动终端，D₃=D₄代表基站；如果系统为无线局域网，D₃≠D₄对应终端之间的一个Ad hoc设置，D₃=D₄=D则代表以D₃(或D₄)作为接入节点的接入网设置。本文假设D₃=D₄为AP，终端T₁和终端T₂为属于用户1和用户2的终端设备。图1中，所有节点均采用时分多址(Time Division Multiple Access，TDMA)方式分享信道，且终端的可用带宽为W Hz。终端采用全向天线进行数据的接收和发送，终端发送的信息可以被终端接收，反之亦然。

系统中，互为中继的终端节点采用放大转发(Amplify and Forward，AF)方式中继数据，并假设每帧的时长小于信道相干时间。在每帧的传输过程中信道增益不变，g_i，j(i，j=1，2表示终端)、g_i，D、g_j，D分别为终端i到终端j、终端i到接入点D和终端j到接入点D的信道增益，当接入点采用最大比合并(Maximal Ratio Combining，MRC)对接收信号进行处理时，终端i通过中继到接入点的等效信噪比为^[11]：

2 效用函数

2.1 效用函数的定义

本文采用SARAYDAR C U等人提出的能量效率函数作为效用函数来衡量终端的收益，其表达式为^[12]：

其中，p_i(i=1，2表示第i个终端)表示发射功率，T_i(p_i)表示单位时间内成功传输的有效信息量，有效吞吐量T_i(p_i)表示为：

2.2 终端效用

假设D2D网络中位置相近且属于不同用户的两个终端建立合作关系，图2给出了合作终端的帧结构。其中，终端传输的每帧时长为T s，每帧中的符号周期为T₀ s。因此，终端在一帧中传输的TDMA符号(时隙)数量N=T/T₀。在D2D协作通信系统中，终端T₁和终端T₂互为中继，终端T₁用T₁₂ s中继终端T₂的数据，用(T-T₁₂)s传输自己的数据；终端T₂用T₂₁ s中继终端T₁的数据，用(T-T₂₁)s传输自己的数据。对于终端T₁来说，有时长为T₂₁的数据会被终端T₂中继，在接入点处利用最大比合并与自己直接发送的那部分数据合并，获得协作分集。而剩余的时长为(T-T₁₂-T₂₁)的信息只会被直接发送，从而无法获得协作分集。同样，终端T₂产生的数据经历相似的过程到达接入点。

通过式(2)对效用函数的定义，如果终端T₁的发射功率为p₁，则终端T₁的效用函数可表示为：

3 基于博弈论的时隙分享合作策略

上文所描述时隙分享问题的纳什谈判解表示方式为^[14]：

过求解上式，可得T12和T21为：

如果协作带宽分配满足上述条件，则终端T₁和终端T₂进行合作，否则终端T₁和终端T₂采用直传策略，即T₁₂=0，T₂₁=0。

4 实验结果及分析

仿真模型由一个接入点和两个终端组成，如图3所示。假设接入点在原点的位置上，终端T₁在X轴方向移动，其坐标为(d₁，0)；终端T₂在y=50的直线上运动，其坐标为(d₂，50)。图3中，d_1D为终端T₁到接入点的距离；d_2D为终端T₂到接入点的距离；d₁₂为终端T₁到终端T₂的距离。仿真中的其他参数设置为：每帧的时长T=5 ms，每帧中的数据I为80 bit，其中有用信息为L=64 bit，假设终端T₁和终端T₂的带宽均W=1 MHz，噪声功率N₀W=5×10^-15 W，终端T₁和终端T₂的发射功率均为0.1 W，调制方式为M-QAM，其误码率如式(7)所示。

图4给出了终端T₁和终端T₂谈判能力随γ_2D变化的情况。仿真实验中，d_1D=800 m，终端T₂在y=50直线上从（0，50）处开始向右移动。从图4中可以看出，当终端T₂距离接入点较近时，其与接入点之间的信噪比γ_2D大于终端T₁与接入点之间的信噪比γ_1D，故此时终端T₂到接入点的信道条件好于终端T₁到接入点的信道条件，终端T₂在谈判中具有优势地位，因此，其具有更大的谈判能力；反之，则终端T1的谈判能力大于终端T₂的谈判能力。

图5给出了DCUGP随γ_2D变化的情况。当γ_2D>12.63 dB时，DCUGP为零，这是因为随着终端T₂到接入点的距离变近，信噪比γ_2D变大，终端T₂到接入点的信道条件变好，对终端T₂来说没必要采取合作。当γ_2D<-0.27 dB时，终端效用增益乘积也为零，这是因为随着终端T₂到接入点的距离变远，终端T₂到接入点的信道条件变差，合作传输效率变低，对终端T₁来说没有必要合作。而当-0.27 dB≤γ_2D≤12.63 dB时，终端效用增益乘积大于零，说明合作给终端T₁和终端T₂都带来了好处，在此情况下，终端T₁和终端T₂采取合作传输策略，本文所提策略起到了激励合作的作用。

图6比较了终端采用合作策略的效用和U₁(p₁)+U₂(p₂)与直传的效用和由图6可以看出，当-0.27 dB≤γ_2D≤12.63 dB时，终端采用合作策略的效用和与直传相比有了明显提升；当γ_2D<-0.27 dB或γ_2D>12.63 dB时，由于终端T₁和终端T₂不合作，因此合作时的效用和与直传时的效用和相等。

图7给出了终端协作带宽分配随信噪比γ_2D变化情况。由图7可以看出，当γ_2D<7.39 dB时γ_1D>γ_2D，此时T₂₁>T₁₂，说明终端T₂到接入点的信道条件劣于终端T₁到接入点的信道条件，因此终端T₂需要提供更多的带宽换取终端T₁的合作；当γ_2D=7.39 dB时，此时T₂₁=T₁₂，说明终端T₂到接入点与终端T₁到接入点具有相同的信道条件，因此终端T₁与终端T₂具有相同的协作带宽分配；当7.39 dB<γ_2D≤12.63 dB时，此时T₂₁<T₁₂，说明终端T₂到接入点的信道条件优于终端T₁到接入点的信道条件，因此终端T₁需要提供比终端T₂更多的带宽以换取终端T₂的合作；而当γ_2D<-0.27 dB或γ_2D>12.63 dB时，终端T₁和终端T₂采用直传方式进行传输，T₂₁=T₁₂=0。

5 结论

为促使D2D网络中从属于不同用户的终端进行合作通信，采用合作博弈理论中的纳什谈判方法，使互为中继的两个终端通过分享时隙的方式进行合作。首先，通过适当选取效用函数以提升终端通信的能量效率，解决了终端合作的动机问题；其次，采用拉格朗日乘数法求解了终端以多大时隙中继彼此数据，解决了终端如何合作的问题。最后，给出了终端合作的截止条件，解决了终端何时合作的问题。

参考文献

[1] 冯大权.D2D通信无线资源分配研究[D].成都：电子科技大学，2015.

[2] KLAUS D，MIKA R，CARL W，et al.Device-to-device communication as an underlay to LTE-Advanced networks[J].IEEE Communications Magazine，2009，47(12)：42-49.

[3] 钱志鸿，王雪.面向5G通信网的D2D技术综述[J].通信学报，2017，37（7）：1-12.

[4] QIAO J，SHEN X S，JON W M，et al.Enabling device-to-device communications in millimeter-wave 5G cellular networks[J].IEEE Communications Magazine，2015，53(1)：209-215.

[5] FENG D Q，LU L，YI Y W，et al.Device-to-device communications in cellular networks[J].IEEE Communications Magazine，2014，52(4)：49-55.

[6] ZHANG Z，SHI J，CHEN H H，et al.A cooperation strategy based on Nash bargaining solution in cooperative relay networks[J].IEEE Transactions on Vehicular Technology，2008，57(4)：2570-2577.

[7] ZHANG C，ZHAO H L.A novel fair cooperation strategy based on Kalai-Smorodinsky bargaining solution for selfish cooperative relay networks[C].Proceedings of IEEE 17th International Conference on Intelligent Transportation Systems.Qingdao：IEEE，2014：2107-2112.

[8] ZHANG G，ZHANG H，ZHAO L，et al.Fair resource sharing for cooperative relay networks using Nash bargaining solutions[J].IEEE Communication Letters，2009，13(6)：381-383.

[9] JANZAMIN M，PAKRAVAN M，SEDGHI H.A gametheoretic approach for power allocation in bidirectional cooperative communication[C].Proceedings of IEEE Wireless Communications and Networking Conference.Sydney：IEEE，2010：1-6.

[10] ZHANG G，YANG K，LIU P，et al.Joint channel bandwidth and power allocation game for selfish cooperative relaying networks[J].IEEE Transactions on Vehicular Technology，2012，61(9)：4142-4156.

[11] KRIKIDIS I，THOMPSON J，MCLAUGHLIN S，et al.Amplify-and-forward with partial relay selection[J].IEEE Communications Letters，2008，12(4)：235-238.

[12] SARAYDAR C U，MANDAYAM N B，GOODMAN D J.Pricing and power control in a multicell wireless data network[J].IEEE Journal on Selected Areas in Communications，2001，19(10)：1883-1892.

[13] GOLDSMITH A.Wireless communication[M].London：Cambridge University Press，2005.

[14] NASH J.The bargaining problem[J].Econometrica，1950，28(2)：155-162.

作者信息:

张闯1，邵坦2，王慧武1

（1.哈尔滨电工仪表研究所有限公司，黑龙江哈尔滨150028；2.河南许继仪表有限公司，河南许昌461000）

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容