Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

Jointly Optimal Sensing
and Resource
Allocation
Overlay Cognitive Radio Networks

1
Luis Miguel López Ramos S

Índice

S Introducción. Objetivos

S Modelado del sistema y planteamiento del problema

S Solución del problema
S Asignación de potencia
S Acceso óptimo
S Detección óptima del PU. Programación dinámica

S Resultados

2

Modelo de CR celular

S Cognitive Radio: Estrategias para aprovechar el espectro
inutilizado

Primary Network Secondary Network

3

CR: Underlay vs. Overlay

S Objetivo CR: limitar la interferencia del usuario secundario (SU)
al usuario primario (PU)

S Underlay CR: mantener la potencia instantánea
de las transmisiones del SU por debajo de cierto
umbral

S Overlay CR: el SU transmite con toda la potencia
disponible, pero sólo en los slots en que el PU está
inactivo
S El SU necesita conocer en qué slots el canal está
libre
4

Motivación

S Los algoritmos de asignación dinámica de recursos
contribuyen a mejorar la eficiencia de los sistemas de
comunicaciones móviles. [Hayes 67]

S En los últimos 5-10 años se han beneficiado del uso de
herramientas de optimización avanzadas

S Los mecanismos de asignación de recursos permiten
aprovechar al máximo el canal, controlando unos recursos, o
variables a optimizar, en función del estado del canal,
cumpliendo una serie de restricciones

5

Motivación

S En sistemas en los que la capacidad de detección es
limitada, el sensado se puede considerar una variable
más a asignar

S El diseño de la asignación de recursos y el esquema de
detección deben realizarse de forma conjunta

S Antecedentes: [Kim 11], [Wang 10], [Zhao 08]

6

Objetivo

S Diseño conjunto de los esquemas de sensado,
asignación de potencia y acceso al canal

S La estrategia para resolver el problema tendrá dos fases:
1. Diseñar de forma óptima la asignación de potencia +
acceso (RA) para cualquier esquema de detección dado
2. Basándonos en la RA óptima obtenida en la fase 1,
diseñar el esquema de sensado óptimo

7

e primary network under control we
To gain insights, we begin by solving (4) without
Modeloconsidering the constraint in (3). Although the prob-
del sistema
probability of interference per band
occurs when ak = 1 (primary user
lem in (4) is not convex, it can be trivially trans-
m
band) and m wk (i ) = 1 (a sec-
formed (relaxed) into a convex problem which yields the
S Red primaria:
nsmitting into the kth band). Hence,
same Karush-Kuhn-Tucker (KKT) conditions2 . More-
bility ofS Correlación temporal
interference amounts to bound
over, without constraint (3), the problem in (4) reduces
S Modelo de ocupación de Gilbert-
1|ak = 1} ≤ ElliotUsing Bayes’ rule
ˇ
ok .
to a sum-rate optimization of an uplink channel with
m S Independencia entre canales
wk and ak are boolean variables, the
orthogonal access. With πm denoting the Lagrange mul-
y can be alternatively que la probabilidad de
S Requiere written as tiplier associated with the constraint in (2), it has been
ser interferido por la red
secundaria sea menor que un that the solution of such problem is (see, e.g., [4])
shown
wk (i ) umbral ok , ∀k,
m
/ Ak ≤ ˇ (3)
m 1 – PFA
S No colabora con la red zk
secundaria ˙m
pm ∗ [n] :=
k ( Ck ) − 1 (h m , πmFA
k
P [n]) ; =0 (5)
the probability of the kth detección de la
S Errores en la band being +
presencia del usuario primario:
wk ∗ [n] :=
m PMD
orresponding primary user. { ( ϕ m [n ]= m ax l ϕ lk [n ]) ∧ ( ϕ m [n ]> k } , wit h
z 0) (6)
PMD, PFA k k

–P =1
to formulate Conocimiento probabilístico[n] := Ck (h m [n], pm ∗1[n]) MD πm [n]pm ∗ [n]. (7)
S the optimization problem ϕk m m
k k − k
de la SIPN (State Information of
g the metric to be optimized. In this PFA = Pr{zk=1|ak=0}
the Primary Network) P = Pr{z =0|a =1}
Note that: i) equation MD corresponds to the well-
8
(5) k k
rested in maximizing the sum-average

Modelo del sistema

S Red secundaria:
S M usuarios, K canales
S Sistema celular con acceso ortogonal.
S Capacidad para adaptar scheduling, potencia y modulación
S Rayleigh Fading, i.i.d. se conoce de forma determinista al inicio de
cada slot de tiempo
S  Conocimiento perfecto de la SISN (State Information of the Secondary
Network)

S La BS realiza la tarea de sensar el canal para detectar la presencia
del PU
S Sensar el canal k tiene un coste ξk

9

SIPN vs. SISN

Time (ms)

Time (ms)
10

SIPN vs. SISN

Time (ms)

Time (ms)
11

Modelo del sistema (II)

h[n] z[n]
ɸ[n]
Access
Acquire Sensing Access
Sensing Decision
SISN Decision channel
(RA)

ξ

12

Formulación del problema

S Variables a optimizar: potencia pkm, acceso (scheduling) wkm,
sensado sk (wkm y sk pueden verse como binarias –indicadores-)
S Otras variables: variables de estado i={h,a}, tasa Ckm (función de pkm e i)
S i varía con el tiempo  pkm, Ckm, wkm, sk, varían con el tiempo

S Objetivo: max. tasa de transmisión:

S Restricciones:
S Potencia media por usuario

S Prob. de interferencia al PU

S Ortogonalidad

S Coste de sensado (detección)

13

Asignación de potencia

S La asignación de recursos es un problema convexo, utilizamos dualidad
para resolverlo.

S Dados un esquema de detección y acceso fijos, la asignación de potencia
óptima es:
Depende del canal SI y del
multiplicador (QoS)

S Nos permite definir un LQI (Link Quality Indicator) para (m,k):

14

Acceso óptimo

S Sin tener en cuenta la restricción de prob. de interferencia, el acceso
óptimo:
Winner-takes-all
!

S Teniendo en cuenta la restricción de prob. de interferencia (la asignación
de potencia no cambia):

S Pero ak (ocupación del primario en el canal k ) no se conoce perfectamente…

15

calculated as: subtracting the cost of sensing:
Acceso óptimo
s [n] = arg max ∗
s[n ]
E R[n] b[n], s[n] + E[R[n
(18)
1
+ γE Vn + 1 (b[n + 1]) b[n], s[n]
= −ξ + Pr(z b[n])E[R
The functional to maximize is the sum0of the expected
z=

S SIPN imperfecta  and substituting (17) and (19)
short-term reward, E[R bt , s[n]] and the expectation of
1
the value function on the next time s[n]= 1](note ξ+
E[R[n] b[n], instant = − the
dependency of both with s[n]). z=
S Si definimos
Let us ﬁrst calculate the expected short-term re-
Now we will derive the exp
ward. If s[n] = 0, the belief is not corrected and
the next time instant. If s[n] = 0
E se calcula 0] = E [R b[n]]. If  = 1, the sensor
S b[n]=[Pr(ak[n]=0); Pr(ak[n]=1)] [R b[n], s[n] =recursivamente s[n] Predicción
/ corrección not corrected, but it is updated
output z can be either 0 (idle) or 1 (busy). Let (b b, z)
S Predicción: basada en modelo de Gilbert-Elliot b[n + 1] = P b[n]. Therefore
denote the updated belief vector given z and, according
S Corrección: a partir de medidas del sensor para los instantes en los que
efectivamente se ha sensado Bayes’ rule:
to E Vn + 1 (b[n + 1]) b[n], s[n]=
1 Pr(z s= 0) Pr(s= 0) D zb
(b b, z) = 3 And therefore, = 1−
Pr(z b) Pr(z s= 1) Pr(s= 1) D 0 Pr(z b)
=
PF A 0
. (19)
0 1− P M D
Pr ( z|s= 0) 0
where D z :=
16
0 P r( z|s= 1)
is known3. The

Variables duales

S Existen distintos esquemas para calcular los multiplicadores
de Lagrange (variables duales).
S En nuestro caso: actualización online de los multiplicadores
mediante gradiente estocástico:

SVentajas del gradiente estocástico: baja complejidad, adaptativo, …
Sμes un tamaño de paso. Existe un trade-off entre: velocidad de
convergencia y pérdida de optimalidad

17

Sensado óptimo

S Hasta ahora: sensado dado  Ahora: optimizamos sensado

S La info. resultante del sensado en el instante n:
S Es útil para instantes posteriores (correlación temporal de la SIPN)
S Si no se sensa, la SIPN se va desactualizando (más incertidumbre)

S Errores en el sensado; no sensamos siempre  conocimiento
probabilístico del estado de ocupación (belief )

S Existe un trade-off entre coste de detección (conocido) y beneficio
esperado en instantes posteriores (a estimar)  Requiere el uso de
Programación Dinámica (DP)

18

Programación dinámica (DP)

S Técnicas para resolver problemas en los que las decisiones
en un instante tienen repercusión en el futuro
S El algoritmo de Viterbi es un ejemplo clásico de DP
S Procesos de decisión de Markov (MDP)
S Nuestro problema de detección es similar a un MDP parcialmente
observable (POMDP)

S Problemas exponencialmente complejos (intratables
computacionalmente)
S Algoritmos aproximados [Bertsekas, Powell]

19

Hallando la política de sensado

S Función objetivo:
S Valor esperado Sensado Lagrangiano RA

S Antes horizonte infinito, ahora finito
S Factor de descuento γ
S Utilizamos la solución óptima obtenida anteriormente (Rkm)

S Para hacerlo más fácil  solución para un usuario y un canal:

Presente Futuro

S Función de valor:

20

Multiusuario, multicanal

S Extensión a varios usuarios:
S El acceso de los SU es ortogonal  Winner-takes-all
S Equivale a dar acceso a un solo usuario cuyo LQI se distribuye
como el máximo de los LQI de los usuarios reales

S Extensión a varios canales:
S Inmediata si asumimos que no existe correlación entre la SIPN de
varios canales
S Calcular una política de sensado independiente para cada canal

21

Resultados
Regiones de decisión:

Sensor S1
(baja calidad):

Sensor S2
(alta calidad):

23

Conclusiones

S Diseño conjunto de RA y Sensado: dos fases

S Sistema de CR  SI heterogénea

S Para explotar la correlación temporal  DP

S Trabajo futuro:
S Correlación de la ocupación entre usuarios primarios
S Restricciones de sensado más complejas
S Algoritmos de baja complejidad para calcular Vn(b)
S Extensión a sistemas underlay

24

Gracias por vuestra atención

25

Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (7)

Similaire à Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

Similaire à Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios (20)

Dernier

Dernier (11)

Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

Notes de l'éditeur