SlideShare une entreprise Scribd logo
1  sur  25
Jointly Optimal Sensing
     and Resource
        Allocation
    Overlay Cognitive Radio Networks




                   1
                       Luis Miguel López Ramos   S
Índice


S Introducción. Objetivos

S Modelado del sistema y planteamiento del problema

S Solución del problema
  S Asignación de potencia
  S Acceso óptimo
  S Detección óptima del PU. Programación dinámica

S Resultados


                             2
Modelo de CR celular

S Cognitive Radio: Estrategias para aprovechar el espectro
  inutilizado




                Primary Network       Secondary Network



                                  3
CR: Underlay vs. Overlay

S Objetivo CR: limitar la interferencia del usuario secundario (SU)
  al usuario primario (PU)


S Underlay CR: mantener la potencia instantánea
  de las transmisiones del SU por debajo de cierto
  umbral



S Overlay CR: el SU transmite con toda la potencia
  disponible, pero sólo en los slots en que el PU está
  inactivo
  S El SU necesita conocer en qué slots el canal está
     libre
                                     4
Motivación


S Los algoritmos de asignación dinámica de recursos
  contribuyen a mejorar la eficiencia de los sistemas de
  comunicaciones móviles. [Hayes 67]

S En los últimos 5-10 años se han beneficiado del uso de
  herramientas de optimización avanzadas

S Los mecanismos de asignación de recursos permiten
  aprovechar al máximo el canal, controlando unos recursos, o
  variables a optimizar, en función del estado del canal,
  cumpliendo una serie de restricciones




                                  5
Motivación


S En sistemas en los que la capacidad de detección es
  limitada, el sensado se puede considerar una variable
  más a asignar

S El diseño de la asignación de recursos y el esquema de
  detección deben realizarse de forma conjunta

S Antecedentes: [Kim 11], [Wang 10], [Zhao 08]




                              6
Objetivo


S Diseño conjunto de los esquemas de sensado,
  asignación de potencia y acceso al canal

S La estrategia para resolver el problema tendrá dos fases:
  1.   Diseñar de forma óptima la asignación de potencia +
       acceso (RA) para cualquier esquema de detección dado
  2.   Basándonos en la RA óptima obtenida en la fase 1,
       diseñar el esquema de sensado óptimo




                                7
e primary network under control we
                                                 To gain insights, we begin by solving (4) without
                          Modeloconsidering the constraint in (3). Although the prob-
                                 del sistema
 probability of interference per band
occurs when ak = 1 (primary user
                                               lem in (4) is not convex, it can be trivially trans-
                      m
 band) and       m   wk (i ) = 1 (a sec-
                                               formed (relaxed) into a convex problem which yields the
     S Red primaria:
 nsmitting into the kth band). Hence,
                                        same Karush-Kuhn-Tucker (KKT) conditions2 . More-
bility ofS Correlación temporal
         interference amounts to bound
                                        over, without constraint (3), the problem in (4) reduces
            S Modelo de ocupación de Gilbert-
  1|ak = 1} ≤ ElliotUsing Bayes’ rule
                 ˇ
                 ok .
                                        to a sum-rate optimization of an uplink channel with
  m         S Independencia entre canales
wk and ak are boolean variables, the
                                        orthogonal access. With πm denoting the Lagrange mul-
y can be alternatively que la probabilidad de
         S Requiere written as          tiplier associated with the constraint in (2), it has been
             ser interferido por la red
             secundaria sea menor que un that the solution of such problem is (see, e.g., [4])
                                         shown
     wk (i ) umbral ok , ∀k,
       m
              / Ak ≤ ˇ               (3)
  m                                                                         1 – PFA
         S No colabora con la red                                                                 zk
             secundaria                                  ˙m
                                          pm ∗ [n] :=
                                           k          ( Ck ) − 1 (h m , πmFA
                                                                       k
                                                                                P [n])       ; =0             (5)
 the probability of the kth detección de la
         S Errores en la band being                                                      +
             presencia del usuario primario:
                                         wk ∗ [n] :=
                                           m                                    PMD
orresponding primary user.                            { ( ϕ m [n ]= m ax l ϕ lk [n ]) ∧ ( ϕ m [n ]> k } , wit h
                                                                                                  z 0)        (6)
             PMD, PFA                                       k                               k

                                                                                –P               =1
 to formulate    Conocimiento probabilístico[n] := Ck (h m [n], pm ∗1[n]) MD πm [n]pm ∗ [n]. (7)
         S the optimization problem      ϕk m         m
                                                              k          k           −             k
             de la SIPN (State Information of
 g the metric to be optimized. In this                            PFA = Pr{zk=1|ak=0}
             the Primary Network)                                 P = Pr{z =0|a =1}
                                               Note that: i) equation MD corresponds to the well-
                                                      8
                                                                      (5)   k   k
rested in maximizing the sum-average
Modelo del sistema

S Red secundaria:
  S M usuarios, K canales
  S Sistema celular con acceso ortogonal.
  S Capacidad para adaptar scheduling, potencia y modulación
  S Rayleigh Fading, i.i.d. se conoce de forma determinista al inicio de
     cada slot de tiempo
     S    Conocimiento perfecto de la SISN (State Information of the Secondary
         Network)


  S La BS realiza la tarea de sensar el canal para detectar la presencia
     del PU
     S   Sensar el canal k tiene un coste ξk


                                         9
SIPN vs. SISN




                Time (ms)




                Time (ms)
     10
SIPN vs. SISN




                Time (ms)




                Time (ms)
     11
Modelo del sistema (II)



   h[n]                z[n]
                                          ɸ[n]
                               Access
Acquire   Sensing                          Access
                     Sensing   Decision
 SISN     Decision                         channel
                                (RA)



                       ξ




                        12
Formulación del problema

S Variables a optimizar: potencia pkm, acceso (scheduling) wkm,
   sensado sk (wkm y sk pueden verse como binarias –indicadores-)
   S Otras variables: variables de estado i={h,a}, tasa Ckm (función de pkm e i)
   S i varía con el tiempo  pkm, Ckm, wkm, sk, varían con el tiempo

S Objetivo: max. tasa de transmisión:

S Restricciones:
   S Potencia media por usuario

   S Prob. de interferencia al PU

   S Ortogonalidad

   S Coste de sensado (detección)

                                       13
Asignación de potencia

S La asignación de recursos es un problema convexo, utilizamos dualidad
   para resolverlo.

S Dados un esquema de detección y acceso fijos, la asignación de potencia
   óptima es:
                                                 Depende del canal SI y del
                                                    multiplicador (QoS)


S Nos permite definir un LQI (Link Quality Indicator) para (m,k):




                                     14
Acceso óptimo

S Sin tener en cuenta la restricción de prob. de interferencia, el acceso
   óptimo:
                                                             Winner-takes-all
                                                             !


S Teniendo en cuenta la restricción de prob. de interferencia (la asignación
   de potencia no cambia):




   S Pero ak (ocupación del primario en el canal k ) no se conoce perfectamente…



                                      15
calculated as:               subtracting the cost of sensing:
                        Acceso óptimo
                                s [n] = arg max ∗
                                                            s[n ]
                                                                     E R[n] b[n], s[n] +        E[R[n
                                                                                                (18)
                                                                                      1
                                                    + γE Vn + 1 (b[n + 1]) b[n], s[n]
                                                                    = −ξ +         Pr(z b[n])E[R
                                         The functional to maximize is the sum0of the expected
                                                                             z=

S SIPN imperfecta                                               and substituting (17) and (19)
                                       short-term reward, E[R bt , s[n]] and the expectation of
                                                                                                       1
                                       the value function on the next time s[n]= 1](note ξ+
                                                               E[R[n] b[n], instant = − the
                                       dependency of both with s[n]).                       z=
S Si definimos
                                     Let us first calculate the expected short-term re-
                                                             Now we will derive the exp
                                 ward. If s[n] = 0, the belief is not corrected and
                                                           the next time instant. If s[n] = 0
                                 E se calcula 0] = E [R b[n]]. If  = 1, the sensor
  S b[n]=[Pr(ak[n]=0); Pr(ak[n]=1)] [R b[n], s[n] =recursivamente s[n] Predicción
    / corrección                                           not corrected, but it is updated
                                 output z can be either 0 (idle) or 1 (busy). Let (b b, z)
    S Predicción: basada en modelo de Gilbert-Elliot       b[n + 1] = P b[n]. Therefore
                                 denote the updated belief vector given z and, according
     S   Corrección: a partir de medidas del sensor para los instantes en los que
         efectivamente se ha sensado Bayes’ rule:
                                     to                     E Vn + 1 (b[n + 1]) b[n], s[n]=
                                                     1    Pr(z s= 0) Pr(s= 0)      D zb
                                       (b b, z) =              3 And therefore, =        1−
                                                  Pr(z b) Pr(z s= 1) Pr(s= 1) D 0 Pr(z b)
                                                                                   =
                                                               PF A   0
                                                                             .       (19)
                                                                       0   1− P M D
                                                         Pr ( z|s= 0)       0
                                       where D z :=
                                         16
                                                               0      P r( z|s= 1)
                                                                                      is known3. The
Variables duales


S Existen distintos esquemas para calcular los multiplicadores
  de Lagrange (variables duales).
S En nuestro caso: actualización online de los multiplicadores
  mediante gradiente estocástico:




     SVentajas del gradiente estocástico: baja complejidad, adaptativo, …
     Sμes un tamaño de paso. Existe un trade-off entre: velocidad de
     convergencia y pérdida de optimalidad


                                    17
Sensado óptimo

S Hasta ahora: sensado dado  Ahora: optimizamos sensado

S La info. resultante del sensado en el instante n:
  S Es útil para instantes posteriores (correlación temporal de la SIPN)
  S Si no se sensa, la SIPN se va desactualizando (más incertidumbre)

S Errores en el sensado; no sensamos siempre  conocimiento
  probabilístico del estado de ocupación (belief )

S Existe un trade-off entre coste de detección (conocido) y beneficio
  esperado en instantes posteriores (a estimar)  Requiere el uso de
  Programación Dinámica (DP)


                                   18
Programación dinámica (DP)


S Técnicas para resolver problemas en los que las decisiones
  en un instante tienen repercusión en el futuro
  S El algoritmo de Viterbi es un ejemplo clásico de DP
  S Procesos de decisión de Markov (MDP)
  S Nuestro problema de detección es similar a un MDP parcialmente
     observable (POMDP)

S Problemas exponencialmente complejos (intratables
  computacionalmente)
  S Algoritmos aproximados [Bertsekas, Powell]



                                  19
Hallando la política de sensado


S Función objetivo:
  S Valor esperado                                      Sensado   Lagrangiano RA

  S Antes horizonte infinito, ahora finito
  S Factor de descuento γ
  S Utilizamos la solución óptima obtenida anteriormente (Rkm)


S Para hacerlo más fácil  solución para un usuario y un canal:


                               Presente             Futuro



S Función de valor:


                                          20
Multiusuario, multicanal


S Extensión a varios usuarios:
  S El acceso de los SU es ortogonal  Winner-takes-all
  S Equivale a dar acceso a un solo usuario cuyo LQI se distribuye
     como el máximo de los LQI de los usuarios reales

S Extensión a varios canales:
  S Inmediata si asumimos que no existe correlación entre la SIPN de
    varios canales
  S Calcular una política de sensado independiente para cada canal




                                 21
Resultados




   22
Resultados
Regiones de decisión:




Sensor S1
(baja calidad):




Sensor S2
(alta calidad):




                            23
Conclusiones

S Diseño conjunto de RA y Sensado: dos fases

S Sistema de CR  SI heterogénea

S Para explotar la correlación temporal  DP



S Trabajo futuro:
  S Correlación de la ocupación entre usuarios primarios
  S Restricciones de sensado más complejas
  S Algoritmos de baja complejidad para calcular Vn(b)
  S Extensión a sistemas underlay


                                 24
Gracias por vuestra atención



             25

Contenu connexe

Tendances (7)

Presentacion: TEORIA DE COLAS
Presentacion: TEORIA DE COLASPresentacion: TEORIA DE COLAS
Presentacion: TEORIA DE COLAS
 
REFLEXIÓN Y REFRACCIÓN DE ONDAS ACÚSTICAS
REFLEXIÓN Y REFRACCIÓN DE ONDAS ACÚSTICASREFLEXIÓN Y REFRACCIÓN DE ONDAS ACÚSTICAS
REFLEXIÓN Y REFRACCIÓN DE ONDAS ACÚSTICAS
 
NG-WDM
NG-WDMNG-WDM
NG-WDM
 
Informe antenas
Informe antenasInforme antenas
Informe antenas
 
Propagacion en el espacio libre
Propagacion en el espacio librePropagacion en el espacio libre
Propagacion en el espacio libre
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuela
 
5.4 flujo maximo
5.4 flujo maximo5.4 flujo maximo
5.4 flujo maximo
 

Similaire à Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

Algoritmos geneticos aplicados al diseno mallas de tierra
Algoritmos geneticos aplicados al diseno mallas de tierraAlgoritmos geneticos aplicados al diseno mallas de tierra
Algoritmos geneticos aplicados al diseno mallas de tierra
Edilson Alvarez
 
Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas Difusos
ESCOM
 
Lecture 14 modulacion digital parte 2
Lecture 14 modulacion digital    parte 2Lecture 14 modulacion digital    parte 2
Lecture 14 modulacion digital parte 2
nica2009
 
Lecture 15 probabilidad de error y ber en señales bandabase binaria
Lecture 15 probabilidad de error y ber en señales bandabase binariaLecture 15 probabilidad de error y ber en señales bandabase binaria
Lecture 15 probabilidad de error y ber en señales bandabase binaria
nica2009
 

Similaire à Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios (20)

Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
 
Algoritmos geneticos aplicados al diseno mallas de tierra
Algoritmos geneticos aplicados al diseno mallas de tierraAlgoritmos geneticos aplicados al diseno mallas de tierra
Algoritmos geneticos aplicados al diseno mallas de tierra
 
CI19 - Presentación 2: Principios básicos de modulación y demodulación
CI19 - Presentación 2: Principios básicos de modulación y demodulación CI19 - Presentación 2: Principios básicos de modulación y demodulación
CI19 - Presentación 2: Principios básicos de modulación y demodulación
 
Ingeniería de control: Tema 2. compensación RF
Ingeniería de control: Tema 2. compensación RFIngeniería de control: Tema 2. compensación RF
Ingeniería de control: Tema 2. compensación RF
 
Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas Difusos
 
Problemas redes
Problemas redesProblemas redes
Problemas redes
 
Tema 3 ecualizacion de-canal
Tema 3 ecualizacion de-canalTema 3 ecualizacion de-canal
Tema 3 ecualizacion de-canal
 
CI19. Presentación 4. Large scale path loss (simplificada)
CI19. Presentación 4. Large scale path loss (simplificada)CI19. Presentación 4. Large scale path loss (simplificada)
CI19. Presentación 4. Large scale path loss (simplificada)
 
CI19.2. Presentaciones: Large scale path loss
CI19.2. Presentaciones: Large scale path lossCI19.2. Presentaciones: Large scale path loss
CI19.2. Presentaciones: Large scale path loss
 
Clase11 Método Mle y momentos
Clase11 Método Mle y momentosClase11 Método Mle y momentos
Clase11 Método Mle y momentos
 
Lecture 14 modulacion digital parte 2
Lecture 14 modulacion digital    parte 2Lecture 14 modulacion digital    parte 2
Lecture 14 modulacion digital parte 2
 
Lecture 15 probabilidad de error y ber en señales bandabase binaria
Lecture 15 probabilidad de error y ber en señales bandabase binariaLecture 15 probabilidad de error y ber en señales bandabase binaria
Lecture 15 probabilidad de error y ber en señales bandabase binaria
 
Tesis
TesisTesis
Tesis
 
Fmcap3 1(1)
Fmcap3 1(1)Fmcap3 1(1)
Fmcap3 1(1)
 
Fmcap3 1[1]
Fmcap3 1[1]Fmcap3 1[1]
Fmcap3 1[1]
 
Act 13 erlang c
Act 13 erlang cAct 13 erlang c
Act 13 erlang c
 
Cadenas de markov
Cadenas de markovCadenas de markov
Cadenas de markov
 
Ecuación
EcuaciónEcuación
Ecuación
 
Ecuación schrodinger
Ecuación schrodingerEcuación schrodinger
Ecuación schrodinger
 
URSI 2008
URSI 2008URSI 2008
URSI 2008
 

Dernier

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Dernier (11)

PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 

Jointly Optimal Sensing and Resource Allocation for Overlay Cognitive Radios

  • 1. Jointly Optimal Sensing and Resource Allocation Overlay Cognitive Radio Networks 1 Luis Miguel López Ramos S
  • 2. Índice S Introducción. Objetivos S Modelado del sistema y planteamiento del problema S Solución del problema S Asignación de potencia S Acceso óptimo S Detección óptima del PU. Programación dinámica S Resultados 2
  • 3. Modelo de CR celular S Cognitive Radio: Estrategias para aprovechar el espectro inutilizado Primary Network Secondary Network 3
  • 4. CR: Underlay vs. Overlay S Objetivo CR: limitar la interferencia del usuario secundario (SU) al usuario primario (PU) S Underlay CR: mantener la potencia instantánea de las transmisiones del SU por debajo de cierto umbral S Overlay CR: el SU transmite con toda la potencia disponible, pero sólo en los slots en que el PU está inactivo S El SU necesita conocer en qué slots el canal está libre 4
  • 5. Motivación S Los algoritmos de asignación dinámica de recursos contribuyen a mejorar la eficiencia de los sistemas de comunicaciones móviles. [Hayes 67] S En los últimos 5-10 años se han beneficiado del uso de herramientas de optimización avanzadas S Los mecanismos de asignación de recursos permiten aprovechar al máximo el canal, controlando unos recursos, o variables a optimizar, en función del estado del canal, cumpliendo una serie de restricciones 5
  • 6. Motivación S En sistemas en los que la capacidad de detección es limitada, el sensado se puede considerar una variable más a asignar S El diseño de la asignación de recursos y el esquema de detección deben realizarse de forma conjunta S Antecedentes: [Kim 11], [Wang 10], [Zhao 08] 6
  • 7. Objetivo S Diseño conjunto de los esquemas de sensado, asignación de potencia y acceso al canal S La estrategia para resolver el problema tendrá dos fases: 1. Diseñar de forma óptima la asignación de potencia + acceso (RA) para cualquier esquema de detección dado 2. Basándonos en la RA óptima obtenida en la fase 1, diseñar el esquema de sensado óptimo 7
  • 8. e primary network under control we To gain insights, we begin by solving (4) without Modeloconsidering the constraint in (3). Although the prob- del sistema probability of interference per band occurs when ak = 1 (primary user lem in (4) is not convex, it can be trivially trans- m band) and m wk (i ) = 1 (a sec- formed (relaxed) into a convex problem which yields the S Red primaria: nsmitting into the kth band). Hence, same Karush-Kuhn-Tucker (KKT) conditions2 . More- bility ofS Correlación temporal interference amounts to bound over, without constraint (3), the problem in (4) reduces S Modelo de ocupación de Gilbert- 1|ak = 1} ≤ ElliotUsing Bayes’ rule ˇ ok . to a sum-rate optimization of an uplink channel with m S Independencia entre canales wk and ak are boolean variables, the orthogonal access. With πm denoting the Lagrange mul- y can be alternatively que la probabilidad de S Requiere written as tiplier associated with the constraint in (2), it has been ser interferido por la red secundaria sea menor que un that the solution of such problem is (see, e.g., [4]) shown wk (i ) umbral ok , ∀k, m / Ak ≤ ˇ (3) m 1 – PFA S No colabora con la red zk secundaria ˙m pm ∗ [n] := k ( Ck ) − 1 (h m , πmFA k P [n]) ; =0 (5) the probability of the kth detección de la S Errores en la band being + presencia del usuario primario: wk ∗ [n] := m PMD orresponding primary user. { ( ϕ m [n ]= m ax l ϕ lk [n ]) ∧ ( ϕ m [n ]> k } , wit h z 0) (6) PMD, PFA k k –P =1 to formulate Conocimiento probabilístico[n] := Ck (h m [n], pm ∗1[n]) MD πm [n]pm ∗ [n]. (7) S the optimization problem ϕk m m k k − k de la SIPN (State Information of g the metric to be optimized. In this PFA = Pr{zk=1|ak=0} the Primary Network) P = Pr{z =0|a =1} Note that: i) equation MD corresponds to the well- 8 (5) k k rested in maximizing the sum-average
  • 9. Modelo del sistema S Red secundaria: S M usuarios, K canales S Sistema celular con acceso ortogonal. S Capacidad para adaptar scheduling, potencia y modulación S Rayleigh Fading, i.i.d. se conoce de forma determinista al inicio de cada slot de tiempo S  Conocimiento perfecto de la SISN (State Information of the Secondary Network) S La BS realiza la tarea de sensar el canal para detectar la presencia del PU S Sensar el canal k tiene un coste ξk 9
  • 10. SIPN vs. SISN Time (ms) Time (ms) 10
  • 11. SIPN vs. SISN Time (ms) Time (ms) 11
  • 12. Modelo del sistema (II) h[n] z[n] ɸ[n] Access Acquire Sensing Access Sensing Decision SISN Decision channel (RA) ξ 12
  • 13. Formulación del problema S Variables a optimizar: potencia pkm, acceso (scheduling) wkm, sensado sk (wkm y sk pueden verse como binarias –indicadores-) S Otras variables: variables de estado i={h,a}, tasa Ckm (función de pkm e i) S i varía con el tiempo  pkm, Ckm, wkm, sk, varían con el tiempo S Objetivo: max. tasa de transmisión: S Restricciones: S Potencia media por usuario S Prob. de interferencia al PU S Ortogonalidad S Coste de sensado (detección) 13
  • 14. Asignación de potencia S La asignación de recursos es un problema convexo, utilizamos dualidad para resolverlo. S Dados un esquema de detección y acceso fijos, la asignación de potencia óptima es: Depende del canal SI y del multiplicador (QoS) S Nos permite definir un LQI (Link Quality Indicator) para (m,k): 14
  • 15. Acceso óptimo S Sin tener en cuenta la restricción de prob. de interferencia, el acceso óptimo: Winner-takes-all ! S Teniendo en cuenta la restricción de prob. de interferencia (la asignación de potencia no cambia): S Pero ak (ocupación del primario en el canal k ) no se conoce perfectamente… 15
  • 16. calculated as: subtracting the cost of sensing: Acceso óptimo s [n] = arg max ∗ s[n ] E R[n] b[n], s[n] + E[R[n (18) 1 + γE Vn + 1 (b[n + 1]) b[n], s[n] = −ξ + Pr(z b[n])E[R The functional to maximize is the sum0of the expected z= S SIPN imperfecta  and substituting (17) and (19) short-term reward, E[R bt , s[n]] and the expectation of 1 the value function on the next time s[n]= 1](note ξ+ E[R[n] b[n], instant = − the dependency of both with s[n]). z= S Si definimos Let us first calculate the expected short-term re- Now we will derive the exp ward. If s[n] = 0, the belief is not corrected and the next time instant. If s[n] = 0 E se calcula 0] = E [R b[n]]. If  = 1, the sensor S b[n]=[Pr(ak[n]=0); Pr(ak[n]=1)] [R b[n], s[n] =recursivamente s[n] Predicción / corrección not corrected, but it is updated output z can be either 0 (idle) or 1 (busy). Let (b b, z) S Predicción: basada en modelo de Gilbert-Elliot b[n + 1] = P b[n]. Therefore denote the updated belief vector given z and, according S Corrección: a partir de medidas del sensor para los instantes en los que efectivamente se ha sensado Bayes’ rule: to E Vn + 1 (b[n + 1]) b[n], s[n]= 1 Pr(z s= 0) Pr(s= 0) D zb (b b, z) = 3 And therefore, = 1− Pr(z b) Pr(z s= 1) Pr(s= 1) D 0 Pr(z b) = PF A 0 . (19) 0 1− P M D Pr ( z|s= 0) 0 where D z := 16 0 P r( z|s= 1) is known3. The
  • 17. Variables duales S Existen distintos esquemas para calcular los multiplicadores de Lagrange (variables duales). S En nuestro caso: actualización online de los multiplicadores mediante gradiente estocástico: SVentajas del gradiente estocástico: baja complejidad, adaptativo, … Sμes un tamaño de paso. Existe un trade-off entre: velocidad de convergencia y pérdida de optimalidad 17
  • 18. Sensado óptimo S Hasta ahora: sensado dado  Ahora: optimizamos sensado S La info. resultante del sensado en el instante n: S Es útil para instantes posteriores (correlación temporal de la SIPN) S Si no se sensa, la SIPN se va desactualizando (más incertidumbre) S Errores en el sensado; no sensamos siempre  conocimiento probabilístico del estado de ocupación (belief ) S Existe un trade-off entre coste de detección (conocido) y beneficio esperado en instantes posteriores (a estimar)  Requiere el uso de Programación Dinámica (DP) 18
  • 19. Programación dinámica (DP) S Técnicas para resolver problemas en los que las decisiones en un instante tienen repercusión en el futuro S El algoritmo de Viterbi es un ejemplo clásico de DP S Procesos de decisión de Markov (MDP) S Nuestro problema de detección es similar a un MDP parcialmente observable (POMDP) S Problemas exponencialmente complejos (intratables computacionalmente) S Algoritmos aproximados [Bertsekas, Powell] 19
  • 20. Hallando la política de sensado S Función objetivo: S Valor esperado Sensado Lagrangiano RA S Antes horizonte infinito, ahora finito S Factor de descuento γ S Utilizamos la solución óptima obtenida anteriormente (Rkm) S Para hacerlo más fácil  solución para un usuario y un canal: Presente Futuro S Función de valor: 20
  • 21. Multiusuario, multicanal S Extensión a varios usuarios: S El acceso de los SU es ortogonal  Winner-takes-all S Equivale a dar acceso a un solo usuario cuyo LQI se distribuye como el máximo de los LQI de los usuarios reales S Extensión a varios canales: S Inmediata si asumimos que no existe correlación entre la SIPN de varios canales S Calcular una política de sensado independiente para cada canal 21
  • 23. Resultados Regiones de decisión: Sensor S1 (baja calidad): Sensor S2 (alta calidad): 23
  • 24. Conclusiones S Diseño conjunto de RA y Sensado: dos fases S Sistema de CR  SI heterogénea S Para explotar la correlación temporal  DP S Trabajo futuro: S Correlación de la ocupación entre usuarios primarios S Restricciones de sensado más complejas S Algoritmos de baja complejidad para calcular Vn(b) S Extensión a sistemas underlay 24
  • 25. Gracias por vuestra atención 25

Notes de l'éditeur

  1. Hacer hincapié en que la célula secundaria es menor que la primaria. Esto justificará muchas de las asunciones de nuestro sistema: La SISN se obtiene mucho más fácilmente ya que la estación base se encuentra cerca de sus receptores,Asumimos además que la red primaria es (como a los informáticos les gusta llamar), legacy. El modelo del sistema primario (GE) es más lento que el secundario. Por eso asumimos el secundario i.i.d. Sin pérdida de generalidad.
  2. Dependiendo de la tipología del sistema primario, los slots en los que el canal está libre pueden ser muy escasos. Esta es la principal dificultad para la consecución de unas buenas prestaciones del canal. Para conseguirlas, el sistema secundario necesita hacer uso de toda la información disponible para asignar sus recursos de forma óptima.
  3. Recordemos que el primario era legacy. Esto justifica que: El modelo del sistema primario (GE) es más lento que el secundario. Por eo lo asumimos i.i.d. Sin pérdida de generalidad.