Integración de sistemas de información textuales y espaciales. Análisis estratégico de la investigación sobre áreas protegidas en España. Pino-Díaz, J.
En el presente trabajo se realiza un análisis estratégico de la investigación sobre áreas protegidas objeto de tesis doctorales leídas en España en el periodo 1979-2004. La información documental se ha extraído de la base de datos TESEO, base de tesis doctorales leídas en España desde 1976, (http://www.mcu.es/TESEO/). A partir de esta información se ha realizado una base de datos propia, en la que se han incluído los campos de interés del presente estudio: disciplinas académicas, miembros de los tribunales y disciplinas y miembros de tribunal, ya tratados para su procesamiento con el sistema de conocimiento Redes 2005 v. 1.0.0. El análisis estratégico se ha realizado con el método ciencimétrico de análisis de palabras asociadas, usualmente utilizado en vigilancia tecnológica e inteligencia competitiva. Para cada uno de los tres campos de estudio se ha obtenido la red y su diagrama estratégico. Con las matrices de distancias, obtenidas a partir de las matrices de co-ocurrencias de Redes 2.005 v. 1.0.0, se ha realizado un análisis estadístico con Statistica 6.0 y SPSS 12.0, con la
finalidad de determinar las coordenadas MDS de los descriptores. Estas últimas se han utilizado como dato de entrada en ArcView 3.2, sistema de información geográfica, para la obtención de mapas en dos y tres dimensiones del dominio “tésis doctorales sobre áreas protegidas”. Se ha comprobado como ArcView 3.2 permite la recuperación de datos de las tablas de atributos de los temas, tanto mediante búsquedas textuales como gráficas, así como la realización de gráficos de diversos tipos a partir de dichos atributos. Por último se ha obtenido con Cortona VRML Client (plug-in para Internet Explorer) el escenario virtual en 3D de dicho dominio.
Guía de visita. Parque Nacional del Archipiélago de Cabrera.Pepe
Contenu connexe
Similaire à Integración de sistemas de información textuales y espaciales. Análisis estratégico de la investigación sobre áreas protegidas en España. Pino-Díaz, J.
Similaire à Integración de sistemas de información textuales y espaciales. Análisis estratégico de la investigación sobre áreas protegidas en España. Pino-Díaz, J. (20)
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
Integración de sistemas de información textuales y espaciales. Análisis estratégico de la investigación sobre áreas protegidas en España. Pino-Díaz, J.
1. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
RESUMEN
En el presente trabajo se realiza un análisis estratégico de la
investigación sobre áreas protegidas objeto de tesis doctorales
leídas en España en el periodo 1979-2004.
La información documental se ha extraído de la base de datos
TESEO, base de tesis doctorales leídas en España desde 1976,
(http://www.mcu.es/TESEO/). A partir de esta información se ha
realizado una base de datos propia, en la que se han incluído los
campos de interés del presente estudio: disciplinas académicas,
miembros de los tribunales y disciplinas y miembros de tribunal, ya
tratados para su procesamiento con el sistema de conocimiento
Redes 2005 v. 1.0.0..
El análisis estratégico se ha realizado con el método
ciencimétrico de análisis de palabras asociadas, usualmente
utilizado en vigilancia tecnológica e inteligencia competitiva. Para
2
2. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
cada uno de los tres campos de estudio se ha obtenido la red y su
diagrama estratégico.
Con las matrices de distancias, obtenidas a partir de las
matrices de co-ocurrencias de Redes 2.005 v. 1.0.0, se ha realizado
un análisis estadístico con Statistica 6.0 y SPSS 12.0, con la
finalidad de determinar las coordenadas MDS de los descriptores.
Estas últimas se han utilizado como dato de entrada en ArcView 3.2,
sistema de información geográfica, para la obtención de mapas en
dos y tres dimensiones del dominio “tésis doctorales sobre áreas
protegidas”. Se ha comprobado como ArcView 3.2 permite la
recuperación de datos de las tablas de atributos de los temas, tanto
mediante búsquedas textuales como gráficas, así como la
realización de gráficos de diversos tipos a partir de dichos atributos.
Por último se ha obtenido con Cortona VRML Client
(plug-in para Internet Explorer) el escenario virtual en 3D de dicho
dominio.
3
3. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
SUMARIO
1. INTRODUCCIÓN ………………………………………………………………….. 8
1.1 ÁREAS PROTEGIDAS………………………………………………… 9
1.1.1 GENERALIDADES……………………………………….. 9
1.1.2 INVESTIGACIÓN SOBRE ENP………………………… 11
1.2 SISTEMAS DE INFORMACIÓN GEOGRÁFICA……….................. 19
1.2.1 GENERALIDADES…………………………................... 19
1.2.2 APLICACIÓN DE SIG AL ANÁLISIS DE DATOS NO
ESPACIALES……………………………….……………. 22
1.3 ANÁLISIS DE PALABRAS ASOCIADAS………………….………. 26
1.3.1 GENERALIDADES…………………………..…………… 26
1.3.2 INGENIERÍA DEL CONOCIMIENTO………………….. 41
1.3.3 VIGILANCIA TECNOLÓGICA, GESTIÓN DEL
CONOCIMIENTO E INTELIGENCIA
COMPETITIVA…………………………………..……….. 43
1.3.4 REDES 2005 v. 1.0.0, SISTEMA DE
CONOCIMIENTO………………………………………... 47
2. OBJETIVOS ………………………………………………………………………. 49
3. MATERIAL Y MÉTODOS………………………………………………….……… 51
3.1 RECOGIDA DE DATOS……………………………………………..… 52
3.2 MÉTODOS DE ANÁLISIS…………………………………………...... 55
4. RESULTADOS………………………………………………………………….…. 60
4.1 REDES DE ACTORES………………………………………..………. 61
4.1.1 RED “DISCIPLINAS ACADÉMICAS”.........................… 63
4.1.2 RED “TRIBUNALES”…………………………………….. 67
4.1.3 RED “DISCIPLINAS-TRIBUNALES”…………………… 71
4.2 ANÁLISIS ESPACIAL DE LA INFORMACIÓN TEXTUAL………. 79
5. DISCUSIÓN DE LOS RESULTADOS………………………………………… 93
6. CONCLUSIONES……………………………………………………………..… 99
7. REFERENCIAS…………………………………………………………..……… 105
4
4. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
LISTA DE FIGURAS
Figura 1.1.- Distribución espacial de grupos de descriptores obtenida
con RefViz. Fuente (Pino J., 2004)………………………………………… …….. 13
Figura 1.2.- Tesis doctorales sobre Sierra Nevada según disciplinas
académicas de realización obtenido con Treemap. Fuente (Pino J.,
2004)………………………………………………………………………..…………… 17
Figura 1.3.- Ventana de un proyecto de ArcView 3.2. Fuente: Elabora-
ción propia..……………………………………………………………………………. 21
Figura 1.4.- Mapa de curvas de nivel que unen autores de Information
Science según su grado de cocitación. Fuente: (Old, J., 2001)……….………… 23
Figura 1.5.- Ejemplo de la aplicación de GISSTI para el análisis
de la investigación sobre desertificación en España, indicadores
bibliométricos y medioambientales. Fuente: (Rey-Rocha J.,
Martín-Sempere, M.J., 2002).…………….…..….................................................. 24
Figura 1.6.- GISSTI: Sistema automatizado para la obtención de
Indicadores de Ciencia y Tecnología basado en la Tecnología SIG.
Fuente: (Rey-Rocha J., Martín-Sempere, M.J., 2001)..…..………………………. 25
Figura 1.7.- Algoritmo de agrupación sobre centros simples. Fuente:
(Bailón-Moreno, R. y Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)....... 31
Figura 1.8.- Diagrama estratégico. Fuente: (Bailón-Moreno, R. y
Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)......................................... 37
Figura 1.9.- Categorías en que se estructura una red. (Bailón-Moreno,
R. y Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)................................ 40
Figura 1.10.- Ingeniería del conocimiento y sus aplicaciones.
(Bailón-Moreno, R. y Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)....... 42
Figura 1.11.- Pirámide de construcción del conocimiento.
(Bailón-Moreno, R. y Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)....... 44
Figura 1.12.- Gestión del conocimiento y gestión de la información.
Fuente: (Bustelo Ruesta, C. y Amarilla Iglesias, R. 2001)……………..………….. 45
Figura 1.13.- Relación entre un sistema de gestión del conocimient
y un sistema de inteligencia competitiva. Fuente: (Escorsa Castells, P., 2002).. 46
Figura 1.14.- Sistema de conocimiento. (Bailón-Moreno, R. y
Ruíz-Baños R., http://www.ugr.es/~rruizb/cognosfera/)........................................ 48
Figura 4.1.- Redes de “disciplinas”, “tribunales” y “disciplinas-tribunales”.
Fuente: Elaboración propia………………….……………………………………….. 62
Figura 4.2.- Red “disciplinas”, subred “etología”. Fuente: Elaboración
propia…………………………………………………………………………………… 63
Figura 4.3.- Red “disciplinas”, subred “ciencias tecnológicas”. Fuente:
Elaboración propia……………………………..……………………………………… 64
Figura 4.4.- Red “tribunales”, subred “Delibes de Castro Miguel”. Fuente:
Elaboración propia…………………………………………………………………….. 67
5
5. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.5,- Red “tribunales”, subred “García Novo Francisco”. Fuente:
Elaboración propia…………………………………………………………………….. 70
Figura 4.6.- Red “disciplinas-tribunales”, “etología”. Fuente: Elaboración
propia. ……………………………………………………………………………………72
Figura 4.7.- Red “disciplinas-tribunales”, “ciencias geográficas”. Fuente:
Elaboración propia…………………………………………………………………….. 73
Figura 4.8.- Red “disciplinas-tribunales”, subredes “florestas”, “química”,
“hidrología” y “botánica”. Fuente: Elaboración propia……………………………… 76
Figura 4.9.- Mapa de miembros de tribunal y descriptores de disciplinas.
Fuente: Elaboración propia………………………………………………….……..… 79
Figura 4.10.- Mapa de bloques disciplinarios o materias. Fuente: Elabo-
ración propia……………………..……………………………….……………..……… 80
Figura 4.11.- Secuencia de imágenes de “navegación” empleando el
mapa de materias como interfaz de acceso. Fuente: Elaboración
propia…………………………………………………………………………………… 83
Figura 4.12.- Mapa y red 4-2-4-14 “disciplinas-tribunales”. Fuente:
Elaboración propia……………………………………………………………………. 84
Figura 4.13.- Mapa de curvas de nivel del fichero “miembros de tribunal”
(ocurrencia mínima 3). Fuente: Elaboración propia………………………………. 85
Figura 4.14.- Mapas altitudinales, en escala de grises y color, del fi-
chero “disciplinas-tribunales” (ocurrencia mínima 4). Fuente: Elaboración
propia…………………………………………………………………………………… 86
Figura 4.15.- Mapa obtenido a partir de la imagen TIN del fichero
“disciplinas-tribunales” (ocurrencia mínima 4). Fuente: Elaboración
propia………………………………………………………………………………..….. 87
Figura 4.16.- Imagen VRML del fichero “disciplinas-tribunales”
(ocurrencia mínima 4). Fuente: Elaboración propia…………………………….… 89
Figura 4.17.- Interfaz de Cortona con visualización del fichero VRML.
Fuente: Elaboración propia…………………………………………………………… 90
Figura 4.18.- Diferentes tipos de gráficos obtenidos a partir de las tablas
de atributos de los temas. Fuente: Elaboración propia…………………………… 92
6
6. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
LISTA DE TABLAS
Tabla 1-1.- Grupos de descriptores y número de referencias bibliográficas en las
que aparecen. Fuente: (Pino J, 2004)………………………………………………. 13
Tabla 1-2.- Descriptores y número de referencias bibliográficas en las que
aparecen. Fuente: (Pino, J., 2004)…………………………………………….……. 15
Tabla 1-3.- Tesis doctorales sobre Sierra Nevada según disciplina académica de
realización. Fuente: (Pino, J., 2004)…………………………………………….…… 16
7
7. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1 INTRODUCCIÓN
8
8. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.1 ÁREAS PROTEGIDAS
1.1.1 GENERALIDADES
Internacionalmente se conceptúa área protegida como “un
área definida geográficamente que haya sido designada o regulada y
administrada a fin de alcanzar objetivos específicos de
conservación” (Convenio de Diversidad Biológica), o bién como “un
área de tierra y/o mar especialmente dedicada a la protección y
mantenimiento de la diversidad biológica y a los recursos naturales y
culturales asociados y gestionada mediante procedimientos legales y
otros medios efectivos” (Unión Internacional de la Naturaleza). En
España el concepto “área protegida” es sinónimo de “espacio natural
protegido”.
Las áreas protegidas se han convertido en una herramienta
eficaz para la conservación de la naturaleza y prueba de ello es que
la superficie continental protegida en el mundo superó en 2003
(EUROPARC-España, 2005) el 11,25%. En España la superficie
protegida supera actualmente los cinco millones de hectáreas, el
9
9. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
10,24% del territorio nacional; de ésta, la mayor parte, el 70%, se
protege bajo la figura de “parque”.
El número de figuras legales de protección es numeroso y
variado, en el caso de nuestro país existen 43 figuras distintas. Las
principales son parque nacional, parque natural y reserva natural,
que suponen el 72,64% de la superficie total protegida y suman 389,
de un total de 1.115 espacios naturales protegidos (de aquí en
adelante ENP).
10
10. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.1.2 INVESTIGACIÓN EN ENP
Del 6 al 7 de abril del 2000, organizado por EUROPARC-
España y la Diputación de Barcelona, se celebró un seminario sobre
“La investigación y el seguimiento en los espacios naturales
protegidos del siglo XXI”. En la monografía que recoge las
ponencias presentadas (Diputación de Barcelona, 2002) se afirma
que “…Una característica común a todos los espacios protegidos es
el difícil acceso a la numerosa y y normalmente dispersa información
existente…, puede estimarse que más del 50% de los estudios e
investigaciones realizados no están publicados.” (Múgica de la
Guerra, M., Gómez-Limón García, J., de Lucio Fernández, J.V.,
2002).
Con carácter general la tipología de los trabajos de
investigación es variada, si bién predominan los trabajos de carácter
descriptivo: censos de especies, cartografiado de especies y
estudios de poblaciones. A nivel general abundan estudios de
11
11. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
biología de poblaciones o comunidades y escasean estudios sobre
aspectos socioeconómicos.
El estudio sobre la literatura científica mundial sobre parques
nacionales recogida por SCI EXPANDED, SSCI y ARTS AND
HUMANITIES CITATION INDEX del año 2004, (Pino, 2004), pone de
manifiesto cómo éstos son objeto de estudio, directa (estudios para
los parques) o indirectamente (estudios en los parques), por trabajos
encuadrables en diversas disciplinas. Predominan los estudios de
ciencias de la vida (biología, zoología, ecología, etc), abundan
también los estudios de ciencias forestales y de ciencias de la tierra
(geología, hidrología, limnología, etc.) (ver Tabla 1 y Figura 1).
12
12. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Nº DE
GRUPO DESCRIPTORES REFER.
BIBLIOGRAF.
0 Range, park, growth, national, summer, temperature, adjacent, ... 8
1 Annual, change, fire, land, landscape, pattern, period, set, time, ... 2
2 Mountain, period, record, age, change, collect, decrease, .. 2
3 Site, national, conservation, density, park, availability, forest, ... 14
4 National, park, population, range, species, abundance, distance, ... 45
5 Adjacent, animal, behavior, component, ecosystem, grassland, ... 1
6 Community, dominate, monitor, set y structure. 1
7 Case, environment, environmental conflict, field, national, ... 1
8 Park, national, species, collect, population, site, water, range, ... 99
9 Concentration, depth, development, field, individual, model, ... 1
10 Soil, nutrient, plant, availability, concentration, ecosystem, forest, ... 13
11 Lake, regional, source, model, water, change, concentration, north, ... 11
12 National, park, male, social, wild, species, range, female, ... 17
13 Tree, forest, spatial, density, pattern, distribution, disturbance, ... 25
14 Species, national, park, community, forest, plant, composition, ... 76
15 Male, female, social, animal, behavior, national, park, period, rate, ... 8
16 Behavior, forage, rate, time, habitat, individual, model, size, ... 6
17 Population, national, park, variation, decline, habitat, model, ... 19
Tabla 1.1. Grupos de descriptores y nº de referencias bibliográficas en las que aparecen. Fuente: (Pino
J., 2004).
Figura 1.1. Distribución espacial, obtenida con RefViz, de los grupos de descriptores Fuente: (Pino J.,
2004)
13
13. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Además aparecen algunos estudios de temática muy diversa:
contaminación ambiental, cambio climático, recreación del visitante,
turismo, economía ambiental, desarrollo sostenible, educación
ambiental, etc. Se comprueba, no obstante, que éstos son poco
numerosos, especialmente en temas como planes de gestión,
desarrollo sostenible, uso público (turismo y recreación) y
actividades humanas (ver Tabla 1.2). Lo cual es profundamente
significativo y caracterizador de que la investigación científica actual
sobre los parques nacionales tiene por objeto el contenido y en raras
ocasiones el continente. Entendiendo por contenido las especies,
poblaciones y comunidades animales y vegetales y los procesos
naturales que en ellos existen o se dan, y por continente el marco de
gestión (planificación, régimen de uso y protección, actividades de
gestión etc.).
14
14. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Nº DE REFER.
DESCRIPTOR %
BIBLIOGRAF.
Sustainable development 3 0.01
Tourism (touris*) 10 0.03
Environmental education 1 0.003
Recreation 10 0.03
Management plan 16 0.05
Management species 32 0.09
Management populations 25 0.07
Management forest 32 0.09
Monitoring 39 0.11
Human activities 11 0.03
Tabla 1.2. Descriptores y nº de referencias bibliográficas en las que aparecen. Fuente: (Pino J., 2004)
Otro trabajo bibliométrico del mismo autor (Pino, 2004) en el
que se que se analizan las tesis doctorales sobre Sierra Nevada
recogidas en la base de datos TESEO, comprueba de nuevo como
los grandes campos disciplinarios productores son Ciencias de la
Tierra y del Espacio, con un 44% (26 tesis), y Ciencias de la Vida,
con un 43% (24 tesis); y como dentro de éstos, las materias más
comunes son Botánica y Geología, con 11 tesis cada una (Ver Tabla
1.3 y Figura 1.2).
15
15. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Nº de Tesis Doctorales sobre Sierra Nevada de la Universidad de
Granada por disciplinas.
Ciencias de la Vida Biofísica 1 25
Botánica 11
Entomología 4
Etología 1
Fisiología Humana 1
Zoología 7
Ciencias de la Tierra y Ciencias Geográficas 2 26
del Espacio
Climatología 1
Edafología 4
Geofísica 2
Geología 11
Geoquímica 1
Hidrología 4
Meteorología 1
Ciencias Tecnológicas 2
Astronomía/Astrofísica 1
Ciencias Médicas 1
Artes y de las letras 1
Historia 1
Química 1
TOTAL 58
Tabla 1.3. Tesis doctorales sobre Sierra Nevada según disciplina académica de realización.
Fuente: (Pino J., 2004)
16
16. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.2. Mapa de tesis doctorales sobre Sierra Nevada según disciplina académica de realización,
obtenido con Treemap. Fuente: (Pino J., 2004)
De todo lo expuesto se deduce que el estudio de la
investigación científica sobre áreas protegidas, tanto de tésis
doctorales como de artículos científicos, pone de manifiesto que, si
bién predominan las disciplinas “naturalísticas” (biología, zoología y
geología), la variedad, riqueza y relevancia de otras disciplinas es
notoria y manifiesta, hecho más “visible” y constatable, como se ha
17
17. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
podido comprobar, en el estudio de las tésis doctorales sobre Sierra
Nevada que en el trabajo sobre la investigación sobre parques
nacionales ISI-2004.
TESEO, por tanto, es fiel exponente de la transversalidad del
objeto de estudio, Áreas Protegidas, y a pesar de sus carencias
(retrasos en la actualización de la base de datos, lagunas en la
cobertura, falta de información en algunos campos, etc.), ha
mostrado su valía en estudios sobre escuelas científicas y redes
académicas en áreas temáticas concretas (Delgado López-Cózar,
E., Torres-Salinas, D., Jimenez-Contreras, E. y Ruíz-Pérez, R.;
2005).
18
18. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.2 SISTEMAS DE INFORMACIÓN GEOGRÁFICA
1.2.1 GENERALIDADES
Los Sistemas de Información Geográfica (en adelante SIG)
son herramientas software desarrolladas con la finalidad de
representar datos georreferenciados, analizar las características y
patrones de esos datos y generar informes con los resultados de
dichos análisis. Los SIG se utilizan fundamentalmente en estudios
sobre el territorio.
Hay diversos SIG en el mercado, en el presente trabajo se ha
empleado ArcView 3.2, de ESRI. El documento principal de trabajo
de ArcView es el proyecto (extensión .apr). El proyecto se compone
de otros subdocumentos que se agrupan generalmente en cinco
clases principales. Cada una de estas clases constituye un interfaz
de usuario o GUI (Graphic User Interface). Los GUIs más comunes
son:
19
19. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
• Vistas: Subdocumento en el que se visualizan, crean,
editan y manejan los temas. Los temas son las
unidades básicas de información, se conocen como
capas de información; cada tema presenta información
sobre un aspecto geográfico del territorio. Existen tres
tipos de temas: vectorial o feature (puntos, líneas y
polígonos), ráster o grid (malla rectangular de celdillas
cuadradas) y TIN o triangulated irregular network
(estructura vectorial tridimensional).
• Tablas: Subdocumento en el que se visualizan, crean,
editan y manejan las tablas o bases de datos
asociadas a cada mapa.
• Gráficos: Subdocumento en el que se visualizan,
crean, editan y manejan gráficos creados a partir de
las tablas.
• Mapas: Subdocumento que se visualizan, crean,
editan y manejan los mapas para imprimirlos.
20
20. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
• Scripts: Subdocumento que se visualizan, crean,
editan y manejan los macros o códigos de
programación en lenguaje Avenue, propio de ArcView.
Al activar un proyecto se despliega la “ventana del proyecto”
(ver Figura 1.3) que da acceso a los diferentes GUIs.
Figura 1.3. Ventana de un proyecto de ArcView 3.2. Fuente: Elaboración propia.
21
21. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.2.2 APLICACIÓN DE LOS SIG AL ANÁLISIS DE DATOS NO
ESPACIALES.
La potencialidad de los Sistemas de Información Geográficos
(SIG) radica en la relación dual que se establece entre la base de
datos relacional y su visualización (el “mapa” o “vista”). Si se dispone
de coordenadas, o valores que pueden ser usados como
coordenadas, cualquier entidad en la base de datos puede ser
presentada en el “mapa” o “vista”, y cualquier atributo asociado con
una entidad puede ser representado como un rasgo (color, tamaño,
símbolo, etcétera). ArcView 3.2 permite trabajar con tablas con
formato dBASE, INFO o Delimited Text.
Jhon Old (2001) emplea ArcView para la visualización de los
datos de cocitación de los autores más citados en el campo de
Information Science obtenidos por White y McCain, (ver figura 1.4).
22
22. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.4. Mapa de curvas de nivel que unen autores de Information Science según su grado de
cocitación. Fuente: (Old, 2001).
Jhon Old analiza el empleo de un sistema de información
geográfica, ArcView 3.2, para el análisis y la visualización en
diferentes imágenes (mapas de curvas de nivel e imágenes TIN y
3D) de información no espacial (datos de cocitación de los autores
más citados en Information Science) y concluye que los SIG son
aplicables al tratamiento de datos no espaciales, si bién resalta el
difícil tratamiento de datos de series temporales por los SIG y apunta
la dirección de futuras investigaciones, desde la perspectiva de la
usabilidad y de los principios de la excelencia gráfica, referentes a su
uso como VIRI (Visual Information Retrieval Interface).
23
23. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
En España se ha desarrollado por el CINDOC el proyecto
GISSTI (Geographic Information System for Science and Technology
Indicators) como aplicación de la tecnología de Sistemas de
Información Geográfica al campo de la Cienciometría y los
Indicadores de Ciencia y Tecnología. En el marco del proyecto
anterior, el CINDOC ha desarrollado una experiencia concreta, el
proyecto HI+DROLOGIA, que ha tenido por objetivo analizar la
investigación española sobre el agua (Rey-Rocha J., Martín-
Sempere, M.J., 2002) (Figuras 1.5 y 1.6).
Figura 1.5. Ejemplo de la aplicación de GISSTI para el análisis de la investigación sobre desertificación
en España, indicadores bibliométricos y medioambientales. Fuente: (Rey-Rocha J., Martín-Sempere,
M.J., 2002).
24
24. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
GISSTI
Sistema automatizado para la obtención de indicadores de Ciencia y Tecnología basado en la tecnología SIG
Jesús Rey-Rocha, María José Martín-Sempere, Mercedes Planas-Garrido
Consejo Superior de Investigaciones Científicas (CSIC). Centro Nacional de Información y Documentación Científica (CINDOC)
Joaquín Costa, 22 - 28002 Madrid (España) sempere@cindoc.csic.es J.Rey@cindoc.csic.es
GISSTI Bases de datos fuente
Geographic Information System for Science and Technology Indicators
Integración de formatos
Identificación de duplicados
Tabla maestra Tabla maestra Tabla maestra
Autores subdisciplinas disciplinas campos científicos
Registros Clasificación
ProyectosI+D
bibliográficos temática Título
Título Organismo responsable
Revista Afiliación Investigador principal
Año Nº investigadores
Vol., Num., pág. autores Fecha inicio-fin
Tipo documento Financiación
Idioma
BD origen
Topónimos Entidad financiadora
(Ámbito geográfico estudiado
en el registro/proyecto)
Organismos
Tabla maestra Tabla maestra Tabla maestra participantes
revistas provincias Organismos y Centros
Título (estandarizados)
ISSN Organismo
Tipo revista Tabla maestra Centro
Localización geográfica
País Comunidades Sector institucional
Factor Impacto
Campo Temático (CHI) Autónomas
Nivel aplicación (Narin)
Tabla maestra Tabla maestra
Tabla maestra países sectores institucionales
tipo revista
(nacional, extranjera SCI,
extranjera no-SCI)
Base de datos relacional
Herramienta de
Cálculo Automatizado Conexión SQL
de Indicadores y
Representación Cartográfica
Interfaz para
Obtención de Gráficos
ArcView
GIS
Herramienta de
Cálculo de Indicadores Relativos
Proyecto financiado por :
Comisión Interministerial de Ciencia y Tecnología de España (CICYT)
Plan Nacional de I+D. Programa Nacional de Aplicaciones y Servicios Telemáticos
Figura 1.6. GISSTI: Sistema automatizado para la obtención de Indicadores de Ciencia y Tecnología
basado en la Tecnología SIG. Fuente: (Rey-Rocha J., Martín-Sempere, M.J., 2001).
25
25. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.3 ANÁLISIS DE PALABRAS ASOCIADAS
1.3.1 GENERALIDADES
(La redacción de este apartado sobre análisis de palabras
asociadas se ha basado en los contenidos que, sobre la materia,
figuran en el portal web “cognosfera” (Bailón-Moreno, R., Ruíz-
Baños, R., 2005) (http://www.ugr.es/~rruizb/cognosfera/)).
El método o análisis de palabras asociadas es una
herramienta ciencimétrica desarrollada inicialmente en el Centre de
Sociologie de l'Innovation (CSI) de l'Ecole Nationale Supérieur de
Mines de Paris y en el Institut de l'Information Scientifique et
Technique (antiguo CDST) del CNRS. El método de las palabras
asociadas considera que el contenido de un documento viene definido
por sus descriptores o palabras clave. (COURTIAL, J. P. y
MICHELET, B., 1990).
La presencia de un descriptor en un documento se denomina
ocurrencia y el resto de descriptores que figuran con él en dicho
26
26. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
documento son sus co-ocurrencias. La matriz de datos "documentos
x descriptores", se denomina matriz de ocurrencias, y representa el
contenido conceptual del campo científico en estudio. La matriz
cuadrada simétrica “descriptores x descriptores” se denomina matriz
de co-ocurrencia, matriz de asociaciones o matriz de adyacencia. El
análisis de la co-ocurrencia de palabras (co-word) estudia la
aparición conjunta de dos o más palabras en campos tales como
títulos, resúmenes o palabras clave. Los valores de las co-
ocurrencias dependen del tamaño de la muestra. Es por tanto
conveniente recurrir a la normalización. Para normalizar la matriz de
adyacencicia se utiliza el índice de asociación o de equivalencia,
índice independiente del tamaño de la muestra (MICHELET, B., 1988)
(Ecuación 1):
Ecuación 1
27
27. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
donde: eij.- Indice de equivalencia o de asociación entre las palabras
i y j.
Cij.- Co-ocurrencia de las palabras i y j.
Ci.- Ocurrencia de la palabra i.
Cj.- Ocurrencia de la palabra j.
Empleando el índice de equivalencia, la matriz de asociaciones
queda normalizada. Los valores de eij oscilan entre 0 y 1; es decir,
cuando dos palabras no aparecen nunca juntas, su co-ocurrencia es
nula, el índice de equivalencia vale cero. En cambio, cuando dos
palabras siempre que aparecen lo hacen juntas en los mismos
documentos, el índice de equivalencia es la unidad. Si dos palabras
aparecen juntas muchas veces pero proporcionalmente son aún mayor
sus ocurrencias por separado, el índice de equivalencia será bajo y el
método de las palabras asociadas considerará la unión poco fuerte. En
cambio, dos palabras poco frecuentes pero siempre que aparecen lo
hacen en los mismos documentos, tendrán un índice de equivalencia
muy elevado y por tanto su asociación será muy fuerte. Así, una
palabra que aparece en muchísimos documentos y que no tiene
28
28. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
"predilección" por aparecer conjuntamente con alguna otra en
particular sino que se reparte homogéneamente con todas, nunca
llegará a formar asociaciones consistentes y el análisis la considerará
demasiado genérica y poco significativa. En realidad se trata de una
medida de similaridad entre descriptores.
Redes 2005 v. 1.0.0 (Bailón-Moreno, R., Ruíz-Baños, R.,
2005) (http://www.ugr.es/~rruizb/cognosfera/redes_2005/index.htm),
software específico para bibliometría, evaluación de la ciencia y
vigilancia tecnológica, empleado en este trabajo, utiliza matrices
normalizadas, o de similaridad, a partir de la co-ocurrencia de
palabras de los documentos, para, posteriormente, obtener
agrupaciones o subredes significativas mediante el algoritmo de
agrupación por centros simples. Este algoritmo ordena los pares de
asociaciones por orden decreciente de índice de equivalencia y sólo
pueden formar parte de esta lista las palabras con una ocurrencia
mínima y los pares con una co-ocurrencia mínima establecidas
previamente. El ordenador inicializa un contador para cada
descriptor y comienza a recorrer la lista desde el principio
29
29. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
incrementando el contador de las palabras que van apareciendo.
Cuando el contador de una palabra alcanza un valor igual al número
de palabras máximo estipulado para los temas menos uno, el
algoritmo toma esta palabra como centro de una agrupación. El
conjunto resultante estará formado por las uniones de esta palabra
central y todas aquellas que se han asociado con ella. El resultado
es una estructura en forma de estrella. Las palabras que han
aparecido se eliminan de la lista y se comienza de nuevo el proceso
para generar más agrupaciones. Si después de recorrer toda la lista
ningún contador llega al valor máximo preestablecido, éste se
disminuye en tantas unidades como sea necesario para formar una
nueva agrupación. El proceso finaliza cuando el valor máximo del
contador disminuya hasta un valor mínimo preestablecido o se
terminen todas las palabras de la lista ordenada de pares.
30
30. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.7. Algoritmo de agrupación sobre centros simples. Fuente: (Bailón-Moreno, R., Ruíz-Baños,
R., 2005)
Este algoritmo tiene la ventaja de que nos asegura que
cualquier subred obtenida contiene al menos una palabra unida a
todas las demás. Esta palabra principal nos va a facilitar la
identificación del tema de investigación.
Una vez identificados los actores o temas, definidos por sus
descriptores y por los enlaces que los unen, es conveniente poder
establecer parámetros numéricos que de alguna forma nos hagan
31
31. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
referencia a sus estructuras internas y a su relación con la globalidad
de la red. Se definen los índices siguientes:
a) Densidad. La densidad o índice de cohesión interna es la
intensidad de las asociaciones internas de un tema y representa el
grado de desarrollo que posee. Se calcula como el cociente entre la
suma de los índices de equivalencia internos y el número de palabras
que definen el tema multiplicado por 100. (Ecuación 2)
Ecuación 2
donde: ei.- Indice de equivalencia del enlace interno i
L.- Número de enlaces internos del tema.
P.- Número de palabras del tema.
32
32. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Por evitar números decimales la densidad suele multiplicarse
por 100. Densidades elevadas corresponden a temas altamente
desarrollados, muy especializados y repetitivos en sus conceptos.
Si ordenamos un conjunto de temas por orden creciente de
densidad, el rango de cada tema es lo que se denomina rango
densidad. Cuando se normaliza, dividiendo entre el número total de
temas de la red, presenta valores entre 0 y 1. Se utiliza en la
construcción del diagrama estratégico como sinónimo de densidad y
es indispensable para hacer estudios comparativos con otras redes y
en estudios dinámicos (Ecuación 3).
Ecuación 3
donde: rango.- Rango del tema según su densidad.
N.- Número de temas de la red.
33
33. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
b) Centralidad. La centralidad o índice de cohesión externa es
la suma de los índices de equivalencia de todos los enlaces externos
que posee un tema. Usualmente el valor de la centralidad se multiplica
por 10 (Ecuación 4).
Ecuación 4
donde: ej.- Indice de equivalencia del enlace externo j
T.- Número total de enlaces externos.
Un tema con elevada centralidad está situado en el centro de la
red y se relaciona muy bien con los demás actores.
Si de forma análoga a la densidad ordenamos un conjunto de
temas por orden creciente de centralidad, el rango de cada tema (que
puede ser también normalizado dividiendo entre el número total de
temas) es lo que se denomina rango centralidad. Se utiliza, junto con
34
34. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
el rango densidad en la construcción del diagrama estratégico como
sinónimo de centralidad y es imprescindible para hacer estudios
comparativos entre redes y en estudios dinámicos (Ecuación 5).
Ecuación 5
donde: rango'.- Rango del tema según su centralidad.
N.- Número de temas de la red.
Si se representa en un diagrama cartesiano en el eje de
abscisas el rango centralidad y en el de ordenadas el rango densidad,
se obtiene el llamado diagrama estratégico (Figura 2.2) El diagrama
se divide en cuatro cuadrantes cuyas características son las
siguientes:
Primer cuadrante: Situado arriba y a la derecha posee una
densidad y centralidad elevadas. Los temas situados en él se
35
35. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
caracterizan por estar muy desarrollados y ser centrales. Juegan un
papel "motor" dentro del campo científico considerado.
Segundo cuadrante: Baja densidad con alta centralidad.
Los temas, bien relacionados pero al tiempo poco desarrollados,
pueden considerarse como emergentes o como temas puente.
Tercer cuadrante: En él se sitúan los temas muy
desarrollados (d elevada) pero poco centrales (c baja) Estos temas
pueden considerarse como altamente especializados representativos
de una alta actividad, pero aislados en el seno del campo científico en
estudio.
36
36. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.8. Diagrama estratégico. Fuente (Bailón-Morerno, R., Ruíz-Baños, R., 2005)
Cuarto cuadrante: La centralidad y la densidad son
bajas, por lo que los temas aquí situados poseen un carácter débil y
netamente marginal. En este cuadrante suelen aparecer por primera
37
37. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
vez los temas y también en muchos casos terminan aquí por
desaparecer definitivamente.
El diagrama estratégico nos puede permitir hacer un análisis de la
estructuración de la red en función del número relativo de temas que
haya en cada cuadrante. Según se distribuyan los temas, pueden
considerarse tres tipos de organizaciones CALLON, M.; COURTIAL, J.
P. y PENAN, H., 1995)(Figura 2.3):
Categoría 1: Categoría 1: Los temas se distribuyen alrededor de la
bisectriz que une los cuadrantes 1 y 4. Esto indica que la red se
organiza en torno a un núcleo de temas bien relacionados y
desarrollados y que están en contacto con un conjunto de temas poco
desarrollados y periféricos.
Categoría 2: La distribución de temas se realiza en torno a la otra
bisectriz formada entre los cuadrantes 2 y 3. Indica que la red está
en vía de estructuración o en vías de desintegración ya que apenas
hay temas motor. La mayor parte de ellos se distribuyen entre temas
especializados y temas puente.
38
38. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Categoría 3: La distribución es muy homogenea, ya que los temas
están repartidos entre los cuatro cuadrantes. La red está entonces
muy bien estructurada, es compleja y muy rica, y presenta todos los
tipos de temas: los hay centrales, los hay periféricos, unos están
bien desarrollados y otros presentan una baja cohesión interna. Una
estructuración de este tipo es indicativa de una buena dinámica del
campo en estudio.
39
39. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.9. Categorías en que se estructura una red. Fuente: (Bailón-Moreno, R. y Ruíz-Baños, R.;
2005)
40
40. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.3.5 INGENIERÍA DEL CONOCIMIENTO
La Ingeniería del Conocimiento tiene por objeto generar nuevo
conocimiento, que antes no existía, a partir de la información
contenida en las bases de datos documentales y mediante el cruce
del contenido de los documentos. En la Figura 2.4 se representa el
paso de la información contenida en las bases de datos a las bases
de conocimiento gracias al Análisis de Palabras Asociadas. Se
especifican además las aplicaciones más representativas que hasta
la actualidad se han realizado.
41
41. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.10. Ingeniería del Conocimiento y sus aplicaciones. Fuente: (Bailón-Moreno, R. y
Ruíz-Baños, R., 2005)
42
42. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.3.6 VIGILANCIA TECNOLÓGICA, GESTIÓN DEL
CONOCIMIENTO E INTELIGENCIA COMPETITIVA.
La vigilancia tecnológica consiste en la observación y el
análisis del entorno científico, técnico y tecnológico y en la posterior
difusión de las informaciones seleccionadas y tratadas que serán
útiles para la toma de decisiones estratégicas. Para conseguir este
objetivo es necesario pasar del análisis de documentos (Nivel 1 o
bibliográfico) de autores o investigadores (Nivel 2 o sociológico) al
estudio del conocimiento que ellos producen y difunden a través de
sus escritos (Nivel 3 o del conocimiento objetivo) (POLANCO, X.,
1997).
43
43. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.11.- Pirámide de construcción del conocimiento. Fuente: Bailón-Moreno, R. y Ruíz-Baños, R.;
2005)
Gestión del conocimiento es todo el conjunto de actividades
realizadas con el fin de utilizar, compartir y desarrollar los
conocimientos de una organización y de los individuos que en ella
trabajan, encaminándolos a la mejor consecución de sus objetivos
(BUSTELO RUESTA, C. y AMARILLA IGLESIAS, R.; 2001).
44
44. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.12. Gestión del conocimiento y gestión de la información. Fuente: (Bustelo Ruesta, C. y
Amarilla Iglesias, R.; 2001)
La Gestión del Conocimiento (GC) en la empresa trata el
capital intelectual como un recurso gestionable.
Inteligencia competitiva es el proceso analítico que transforma
datos desagregados de los competidores, industria y mercado en
conocimiento aplicable a nivel estratégico, relacionado con las
capacidades de los competidores.
45
45. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
La GC se ocupa de inventariar, clasificar y compartir el
conocimiento del interior de la empresa, mientras que la IC explora
las señales del exterior y se orienta al futuro (Figura 1.13).
Figura 1.13. Relación entre un sistema de gestión del conocimiento y un sistema de inteligencia
competitiva. Fuente: (Escorsa Castells, P.; 2002)
46
46. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
1.3.4 REDES 2005 v. 1.0.0, SISTEMA DE CONOCIMIENTO
Redes 2005 v. 1.0.0 es un programa de ordenador con
características avanzadas de Sistema de Conocimiento. Permite
trazar redes TecnoCientíficas basadas en palabras, co-autorías, co-
citas (de documentos, de autores, de revistas, etc.) y co-enlaces
(páginas web de internet). Puede utilizar todo tipo de documentos
textuales: artículos científicos, comunicaciones a congresos,
patentes de invención, informes, páginas web, etcétera.
Sus algoritmos están basados en el Análisis de Palabras
Asociadas, que por sus características especiales son capaces de
identificar los denominados centros de interés de las redes. Además
permite, mediante el análisis de palabras asociadas, realizar
estudios que van desde grandes dominios científicos (nivel macro),
pasando por estudios de universidades, laboratorios, revistas (nivel
meso), hasta incluso el perfil investigador de científicos individuales
(nivel micro) o incluso, el análisis de tan sólo un documento aislado
(nivel nano).
47
47. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 1.14. Sistema de Conocimiento. Fuente: (Bailón-Moreno, R. y Ruíz-Baños, R.; 2005)
48
48. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
2 OBJETIVOS
49
49. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Los Espacios Naturales Protegidos constituyen una
herramienta pública de conservación de las áreas naturales de
mayor valor ecológico, geológico y paisajístico, muy utilizada por las
Administraciones Publicas durante los últimos treinta años. Estas
áreas naturales son objeto de una gestión activa (conservación, uso
publico, aprovechamientos tradicionales e investigación), lo que ha
permitido, para los fines de este trabajo, la realización en España de
numerosas tésis doctorales en diferentes disciplinas científicas.
Estos trabajos, en su conjunto, no han sido estudiados en
profundidad desde la perspectiva de Evaluación de la Ciencia y del
Conocimiento Científico. En el presente trabajo se pretende realizar
el análisis estratégico de la investigación sobre áreas protegidas
recogida en tésis doctorales leídas en España, integrando sistemas
de información textuales y espaciales.
50
50. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
3 MATERIAL Y MÉTODOS
51
51. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
3.1 RECOGIDA DE DATOS
Como fuente de datos se ha utilizado TESEO, base de datos de
tesis doctorales leídas en España desde 1976 hasta 2005. Se ha
realizado una búsqueda el 07/12/2005 sobre áreas protegidas o
espacios naturales protegidos (parques nacionales, parques
naturales o reservas naturales) en los campos título y resumen. La
ecuación de búsqueda ha sido “parque$ natural$ or parque$
nacional$ or reserva$ natural$ or area$ protegida$ or espacio$
natural $ protegido$”.
La búsqueda ha dado como resultado 190 tesis. Uno de los
registros ha sido descartado por no tener relación con el tema de
investigación (“Parques arqueológicos en áreas urbanas. La gestión
para la conservación. Foros Imperiales, Appia Antica, Valle de los
Templos”), restando, por tanto, 189 registros útiles.
52
52. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
A partir de la información en formato hipertexto que
proporciona “Teseo” (título, autor, año académico, universidad,
centro de lectura, departamento, programa de doctorado, centro de
realización, director, tribunal, descriptores y resumen), se ha
realizado una base de datos en Microsoft Access a la que se han
añadido los campos “todos_tribunal”, todos_descriptores”,
“tribunal+descriptores”, “figura de protección”, “nombre del espacio
natural protegido”, “provincia”, “comunidad autónoma” y “país”. Los
campos “todos_tribunal”, todos_descriptores”, “tribunal+descriptores”
se han tratado para su posterior procesamiento por Redes 2005 v.
1.0.0
DOC1: descriptor 1/descriptor2/descriptor3/…
DOC2: descriptor 1’/descriptor2’/descriptor3’/…
…
DOCn: descriptor 1’’/descriptor2’’/descriptor3’’/…
53
53. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Se ha realizado control de autoridades de los campos “autor”
y “tribunal”, no así en el caso de los descriptores de disciplinas
puesto que la base de datos ya los incorpora normalizados según la
“Nomenclatura Internacional de la UNESCO para los campos de
ciencia y tecnología”.
54
54. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
3.2 MÉTODOS DE ANÁLISIS
El análisis de palabras asociadas ha permitido obtener las
redes formadas por disciplinas académicas y miembros de tribunal,
por separado y en conjunto. Las redes están constituídas por
subredes que se nombran por el descriptor que se sitúa en el centro
de la subred. Las subredes se caracterizan, entre otros, por dos
parámetros muy importantes: el índice de cohesión externa y el
índice de cohesión interna. El índice de cohesión externa, también
llamado centralidad, indica cómo de bien se relaciona la subred con
el resto de la red (una subred con centralidad alta está próximo al
centro de la red). La densidad o índice de cohesión interna indica el
desarrollo interno de la subred. Si se representan las subredes en
función de su centralidad y su densidad se obtiene el diagrama
estratégico de la red; éste se divide en cuatro cuadrantes: cuadrante
superior derecho, subredes “motor” de la investigación (altas
centralidad y densidad); cuadrante inferior derecho (alta centralidad
y baja densidad), subredes generales o de importancia general o
55
55. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
estructural, pero que al ser de amplia aplicación y relacionarse con
todo a la vez están en el centro de la red y no pueden dibujarse
nítidamente; cuadrante superior izquierdo, subredes accesorias, o
metodologías o ramas de otras ciencias que se acercan a esta red
(presentan alta densidad y baja centralidad); cuadrante inferior
izquierdo, subredes alejadas (baja centralidad) y poco densas
porque son nacientes o están en periodo de desaparición o porque
por su naturaleza no pueden llegar a construirse completamente.
Con Redes 2005 v. 1.0.0
(http://www.ugr.es/~rruizb/cognosfera/redes_2005/index.htm) se ha
procedido al análisis estratégico de los campos “todos_tribunal”,
“todos_descriptores” y “tribunal+descriptores”.
El análisis del campo “todos_descriptores” se ha realizado
fijando una ocurrencia mínima de 2, una coocurrencia de 2, un
tamaño mínimo de grupo de 3 (mínimo tamaño que permite el
56
56. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
programa) y un tamaño máximo de grupo de 7 (máximo número de
descriptores encontrado en una tésis).
El análisis del campo “todos_tribunal” se ha realizado
fijando una ocurrencia mínima de 2, una coocurrencia de 2, un
tamaño mínimo de grupo de 3 (mínimo tamaño que permite el
programa) y un tamaño máximo de grupo de 7 (máximo número de
miembros de tribunal en una tésis).
El análisis de “tribunal_descriptores” se ha realizado fijando
una ocurrencia mínima de 2, una coocurrencia de 2, un tamaño
mínimo de grupo de 6 y un tamaño máximo de grupo de 14.
A partir de la matriz de adyacencia o matriz de co-ocurrencias
de “tribunal_descriptores”, matriz simétrica de 81 por 81, fijando
una ocurrencia mínima de cuatro, se ha realizado mediante Statistica
6.0 el análisis MDS de la matriz de distancias (1-Pearson), obtenida
57
57. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
a partir de la matriz de similaridades (Pearson), al objeto de obtener
las coordenadas de los 81 descriptores.
Con las coordenadas de los descriptores multiplicadas por
100.000, para que ArcView las “reconozca”, se ha generado una
tabla de atributos en archivo de texto, “.txt”, que se ha importado con
Arc View 3.2 para realizar el proyecto (vista, tabla, gráfico y mapa)
de la investigación sobre áreas protegidas en España.
La extensión 3D Analyst de Arc View 3.2 se ha empleado para
obtener mapas de curvas de nivel (en nuestro caso “curvas de
ocurrencias”) y ficheros TIN (Triangulated Irregular Network), usados
para modelizar mapas de altitudes. Los ficheros TIN han sido
exportados en formato VRML (Visual Reality Modeling Language) y
visualizados con Cortona VRML Client.
Con el programa Arc View 3.2 se han modificado las tablas de
atributos de las vistas España-Comunidades y Andalucía para
58
58. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
realizar gráficos con los datos de los atributos de las tablas y
visualizar sobre el territorio la productividad de cada región y
provincia, en el caso de Andalucía.
59
59. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4 RESULTADOS
60
60. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4.1 REDES DE ACTORES
Se han obtenido los diagramas estratégicos y las diferentes
subredes de los campos “todos_descriptores”, “todos_tribunal” y
“tribunal+descriptores” (ver Figura 4.1).
Red “disciplinas”
61
61. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
”Red “tribunales”
Red “tribunales_disciplinas”
Figura 4.1. Redes de “disciplinas”, “miembros de tribunal” y “tribunales-disciplinas.
Fuente: Elaboración propia.
62
62. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4.1.1 RED “DISCIPLINAS ACADÉMICAS”
El análisis de la investigación sobre áreas protegidas, según
el análisis de palabras asociadas del campo “todos_descriptores”, ha
dado como resultado una red de 112 descriptores (124 se han
descartado por tener una sola ocurrencia) y de 13 subredes
(“derecho administrativo”, “etología”, “geografía”, “ciencias médicas”,
“ciencias tecnológicas”, “entomología”, “hidrología”, “botánica”,
“ciencias económicas”, “florestas”, “ciencias geográficas”,
“edafología” y “geología”).
Según el diagrama estratégico de la red “disciplinas”, la
principal subred “motor” de investigación es “etología” (con dos
áreas: << etología / etología animal / comportamiento animal /
comportamiento de primates / antropología física >> y << ecología
animal / zoología >>) (Figura 4.2), seguida de “ciencias
tecnológicas” (<< ciencias tecnológicas / regeneración del agua /
planificación urbana / usos del suelo urbano / ingeniería y tecnología
63
63. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
del medio ambiente / control de la contaminación del agua >>)
(Figura 4.3).
Figura 4.2. Red “disciplinas”, subred “etología”
64
64. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.3. Red “disciplinas”, subred “ciencias tecnológicas”. Fuente: Elaboración propia.
Las subredes estructurales o generalistas de la red
“descriptores” son “hidrología” (<< limnología / hidrogeología /
aguas superficiales / aguas subterráneas / calidad de las aguas >>),
“botánica” (<< ecología vegetal / ciencias de la vida / taxonomía
vegetal / botánica general / flora lacustre / flora mediterránea >>),
“florestas” (<< silvicultura / protección de florestas / conservación
de florestas >>) y “ciencias geográficas” (<< geografía física /
65
65. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
biogeografía / cartografía geográfica / geografía de los recursos
naturales / usos del suelo >>).
Subredes de disciplinas adyacentes son “derecho
administrativo” (<< ciencias jurídicas y derecho / derecho y
legislación nacional / derecho internacional / derecho marítimo >>),
“ciencias médicas” (<< toxicología / química agrícola / plaguicidas /
ciencias veterinarias >>), “geografía” (<< geografía económica /
“geografía del desarrollo regional /geografía rural / distribución de
recursos naturales >>) y “entomología” (<< ecología de los
insectos / taxonomía de los insectos / entomología general >>).
Como subredes emergentes aparecen “ciencias
económicas” (<< teoría económica / economía sectorial / sector de
hostelería y turismo >>), “edafología” (<< cartografía de suelos /
biología de suelos >>), “geología” (<< teledetección / geología
ambiental / geomorfología >>)
66
66. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4.1.2 RED “TRIBUNALES”
El análisis de la investigación sobre áreas protegidas, según
los tribunales de las tésis, ha dado como resultado una red de 156
investigadores (746 solo ocurren una sola vez) con 13 subredes:
Figura 4.4. Red “miembros de tribunal”, subred “Delibes de Castro Miguel”. Fuente: Elaboración propia.
“López Ramón Fernando”, “Borrás Suarez Miguel”, “García Novo
Francisco”, “Soriano López Juan Manuel”, “Pérez Hurtado de
67
67. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Mendoza Alejandro”, “Fernando Rodrigo María Dolores”, “Díaz
Muñoz María Angeles”, “Molero Mesa Joaquín”, “Miracle Solé María
Rosa”, “Delibes de Castro Miguel”, “Santos Martínez Tomás”,
“Azqueta Oyarzún Diego” y “Diaz Pineda Francisco”.
Todas las subredes obtenidas se caracterizan por su baja o
nula centralidad, es decir, se trata de grupos cerrados de
investigadores que no se relacionan con el resto de investigadores
para formar tribunales de tésis, realmente no constituyen red, sino
un conjunto de subredes. Predominan las subredes de tres nodos
(seis grupos formados por tres investigadores), seguida de tres
subredes de seis investigadores, dos subredes de cuatro, una de
siete y una de cinco.
Las tres subredes de mayor centralidad (7,770; 4; 4), aunque
ésta sea mínima, respectivamente son: “Molero Mesa Joaquín”
(con seis nodos: “Mota Poveda J.F.”, Muñoz Alvarez J.M.”, “Blanca
López G.”, “Cano Carmona E.” y Valle Tendero F.”), “Miracle Sole
68
68. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Maria Rosa” (con seis nodos: “Rodríguez Babio C.”, “Cruz Pizarro
L.J.”, “Esteban Sanchos J.G.”, “Feliu José C.” y “Mas Coma S.”) y
“Delibes de Castro Miguel” (con siete nodos: Hiraldo Cano F.”, “de
Lope Florentino”, “Suarez Cardona F.”, “Donazar Sancho J.A.”,
“Telleria Jorge J.L.” y “Montes del Olmo C.” ). Joaquín Molero Mesa,
Catedrático de Biología Vegetal de la Universidad de Granada da
nombre a la subred formada por los botánicos de la Universidad de
Granada, la Universidad de Almería, la Universidad de Jaén y la
Universidad de Córdoba. Miracle Solé María Rosa (Catedrática de
Ecología de la Universidad de Valencia) agrupa a parasitólogos,
profesores de la Universidad de Barcelona y de la Universidad de
Valencia y al Catedrático de Ecológía de la Universidad de Granada,
Cruz Pizarro. Miguel Delibes de Castro, profesor de investigación del
CSIC, reúne alrededor suyo el grupo de ecólogos-zoológos de la
Estación Biológica de Doñana, la Universidad Autónoma de Madrid,
La Universidad Complutense de Madrid y Universidad de
Extremadura.
69
69. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Otra subred importante es la denominada “García Novo
Francisco”, por ser de entre las de mayor densidad (92,233) la que
mayor número de nodos posee (6). Está formada por: “Castroviejo
Bolívar J.”, “Escudero García J.C.”, “Pablo Casanovas F.”, “Valdes
Castrillon B.” y “Valverde Gomez J.A.”, todos ellos investigadores de
larga y reconocida reputación.
Figura 4.5. Red “miembros tribunal”, subred “García Novo Francisco”. Fuente: Elaboración propia.
70
70. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4.1.3 RED “DISCIPLINAS-TRIBUNALES”
Este análisis permite relacionar investigadores y temas de
investigación y construir subredes conjuntas. Esta red está formada
por 14 subredes y 268 investigadores-descriptores, de un total de
1.141.
Subredes “motor” en la investigación sobre áreas protegidas
(subredes que aparecen en el primer cuadrante): La subred que
aparece más destacada por su centralidad (71,650) y densidad
(78,721) es “etología”. Esta subred de 14 nodos, siete
investigadores (M. Delibes de Castro, V. Castelló Losada, J.L.
Tellería Jorge, L. Arias de Reina Martínez, F. Hiraldo Cano y F.
Braza Lloret) y siete descriptores (etología, etología animal,
comportamiento animal, comportamiento de los primates,
antropología física, zoología y ecología animal) (Figura 4.6).
71
71. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.6. Red “disciplinas-tribunales”, subred “etología”. Fuente: Elaboración propia.
Le sigue “ciencias geografícas”, con una centralidad de
59,630 y una densidad de 63,292, (en adelante: 59,630/63,292). Es
una subred de 14 nodos formada por siete investigadores (J. Bosque
Sendra, E. Chuvieco Salinero, J. Martínez Vega, M.A. Díaz Muñoz,
J.C. García Codrón, M. de Miro Orell y J.M. Rubio Recio) y siete
descriptores (ciencias geograficas, cartografia geografica, geografia
física, biogeografía, geografia de los recursos naturales y usos del
suelo) (Figura 4.7).
72
72. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.7. Red “disciplinas-tribunales”, subred “xciencias geográficas”. Fuente: Elaboración propia
Subredes generales o de importancia general o estructural en
la investigación sobre áreas protegidas (subredes del segundo
cuadrante): Las subredes “florestas” (51,860/48,128), “química”
(47,400/41,345), “hidrología” (84,440/40,571) y “botánica”
(114,160/29,607) del cuadrante inferior derecho del diagrama
estratégico, constituyen la “estructura del edificio” de la investigación
sobre áreas protegidas. Botánica aparece como la subred de mayor
73
73. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
centralidad, es decir la subred con mayor número de enlaces
exteriores (Figura 4.8).
“florestas”
74
74. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
“química”
“hidrología”
75
75. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
“botánica”
Figura 4.8: Red “disciplinas-tribunales”, subredes “florestas”, “química”, ”hidrología” y “botánica”.
Fuente: Elaboración propia.
Subredes accesorias, o metodologías o ramas de otras
ciencias que se acercan a esta red de investigación sobre áreas
protegidas: “Ciencias jurídicas y del derecho” (0,000/134,100),
“Miracle Solé M. Rosa” (0,000/72,700) , “ornitología”
(0,000/67,012) y “entomología” (0,000/66,650), juristas,
parasitólogos, ornitólogos y entomólogos, respectivamente, son
subredes de alta densidad y baja centralidad, es decir, de gran
76
76. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
cohesión interna y nula, como es el caso, o muy baja relación con el
resto. Ciencias Jurídicas y del Derecho aparece como la subred de
mayor densidad, es decir la más cohesionada, con mayor número de
enlaces internos. Hay otra subred, “edafologia” (0,000/59,342), que
aunque aparece en el tercer cuadrante, está muy próxima a las
anteriores, pudiéndose considerar como una rama científica
adyacente al conjunto de ciencias que soportan la investigación
sobre áreas protegidas.
Subredes alejadas (baja centralidad) y poco densas porque
son nacientes o están en periodo de desaparición o porque por su
naturaleza no pueden llegar a construirse completamente: Las
subredes “geografia”, “ciencias económicas” y “geologia”, de
baja densidad y baja centralidad, se sitúan en el cuadrante inferior
izquierdo del diagrama estratégico. Las subredes ”geografia” y
“geologia” destacan por su proximidad al segundo cuadrante,
cuadrante de las subredes generales, y podrían considerarse que
forman parte del grupo de ciencias estructurales de la investigación
77
77. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
sobre áreas protegidas. La subred “ciencias económicas” es una
subred emergente, dado el interés que los aspectos turísticos de las
áreas protegidas han suscitado los últimos años.
78
78. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
4.2 ANÁLISIS ESPACIAL DE LA INFORMACIÓN TEXTUAL
Se ha obtenido con Arc View 3.2 la visualización del fichero
de coordenadas MDS de miembros de tribunal y descriptores de las
tesis leídas en España sobre áreas protegidas (Figura 4.9).
Figura 4.9. Mapa “miembros de tribunal y descriptores de disciplinas. Fuente: Elaboración propia.
79
79. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Sobre la vista de “miembros de tribunal y descriptores” se ha
realizado un agrupamiento de las disciplinas según los grupos
definidos en la nomenclatura de la UNESCO y se ha obtenido el
mapa por materias de las tesis españolas sobre áreas protegidas
(Figura 4.10).
Figura 4.10. Mapa de bloques disciplinarios o materias. Fuente: Elaboración propia.
Esta imagen de síntesis puede ser utilizada como interfaz de
acceso, mediante hipertexto, al listado de las tésis doctorales de la
80
80. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
zona del mapa seleccionada y desde éstos al resumen de la tésis
seleccionada (Figura 4.11).
81
81. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
82
82. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.11. Secuencia de imágenes de “navegación” empleando el mapa de materias como interfaz de
acceso.
Sobre la vista de “miembros de tribunal y descriptores” se ha
realizado un agrupamiento de acuerdo con las subredes obtenidas
en el diagrama estratégico de la red 4-2-4-14 (Figura 4.12).
83
83. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.12. Mapa y Red 4-2-4-14 “disciplinas-tribunales”. Fuente: Elaboración propia.
84
84. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
La coordenada “z” de cada registro, número de ocurrencias
totales de cada descriptor, se ha empleado para realizar tres tipos de
mapas de “cotas”: mapa de curvas de nivel (Figura 4.13) y mapas de
superficies altitudinales (color y escala de grises) (Figura 4.14)
Figura 4.13. Mapa de curvas de nivel del fichero miembros de tribunal (ocurrencia mínima 3). Fuente:
Elaboración propia.
85
85. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.14. Mapas altitudinales en escala de grises y color del fichero miembros de tribunal-disciplinas
(ocurrencia mínima 4). Fuente: Elaboración propia.
86
86. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
La extensión 3D Analyst de Arc View 3.2 ha permitido obtener
la imagen tridimensional en color (imagen TIN) (Figura 4.15).
Figura 4.15. Mapa obtenido a partir de la imagen TIN. Fuente Elaboración propia.
La extensión 3D Analyst de Arc View 3.2 permite exportar en
formato VRML la imagen TIN obtenida (Figura 4.16).
87
87. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
88
88. Integración de sistemas de información Pino-Díaz J.
textuales y espaciales. Análisis estratégico
de la investigación sobre áreas protegidas
en España.
Figura 4.16. Imagen VRML tridimensional. Fuente Elaboración propia.
89