![]() |
Revista
Latina de Comunicación Social 64 - 2009
|
|
Edita: LAboratorio de Tecnologías de la Información
y Nuevos Análisis de Comunicación Social |
|
La temática de Revista Latina de Comunicación Social, 1998-2008 Revista Latina de Comunicación Social's thematic 1998-2008 Dr. Raymond Colle [C.V.]
Ex profesor de la Pontificio Universidad Católica de Chile
y de la Universidad Diego Portales Resumen: Con más de diez años de vida, Revista Latina de Comunicación Social se ha transformado en una importante muestra del pensamiento y de la investigación iberoamericana en materia de comunicación social. Recuperando las palabras clave o, en su defecto, los títulos de los artículos publicados, hemos analizado la temática cubierta y su evolución. La metodología se basa en estadísticas: de palabras (originales), de los campos conceptuales en que se han de reagrupar para aislar los temas tratados y de las coocurrencias de dichos campos en la descripción de cada artículo. En los once años transcurridos, la atención se ha dirigido principalmente hacia la prensa y el periodismo, la televisión y las nuevas tecnologías digitales (Internet). Palabras clave: Comunicación social; análisis de contenido; red semántica; significado; coocurrencia; concepto: palabras clave; Revista Latina de Comunicación Social; Anatex; NetDraw. Abstract: With more than ten years of life, Revista Latina de Comunicación Social has become an important showcase of thought and of Ibero-American research in the field of social communication. Retrieving the keywords or, failing that, the titles of articles published, we have analyzed the issues covered and their evolution. The methodology is based on statistics of words (originals), of the conceptual discussed and the coocurrences of these fields in the description of each article fields in which they were regrouped to identify the topics. Through eleven years, attention was most payed on the press, journalism, television and new digital technologies (Internet). Key Words: Social communication; Semantic analysis; semantic network; meaning; coocurrence, concept; key words; Revista Latina de Comunicación Social; Anatext; NetDraw. Sumario: 1. Introducción. 2. Metodología. 2.1. Análisis estadístico. 2.2. Graficación. 3. Etapas de análisis. 4. Resultados. 4.1. Términos. 4.2. Temas. 4.2.1. Frecuencias netas. 4.2.2. Variación anual. 4.3. Coocurrencias. 4.4. Observaciones. 5. Conclusión. 6. Bibliografía. Summary: 1. Introduction. 2. Methodology, 3. Statistical analysis. 2.2. Graphing. 3. Stages of analysis. 4. Results. 4.1. Terms. 4.2. Themes. 4.2.1. Absolute frequencies. 4.2.2. Yearly variation. 4.3. Coocurrences. 4.4. Comments. 5. Conclusion. 6. References. Traducción supervisada por la Prof. Dra. María Luz González (ULL) 1. Introducción Revista Latina de Comunicación Social cumple ya más de diez años de existencia. Partió en 1998 con una edición mensual, sumando ese año más de 140 artículos. En 2001, 2002 y 2003, hubo ediciones que cubrieron varios meses. En julio de 2003, la edición se hizo semestral, hasta fines de 2005, después de lo cual se optó por una edición anual, aunque actualizándose cada vez que se aceptaba un nuevo artículo. La frecuencia de publicación –y el número de artículos– bajó notoriamente en los años 2003 y siguientes, para repuntar en 2008, con mayor número de artículos recibidos (63) y publicados (42). A través de sus diversos índices es relativamente fácil observar la cantidad de autores que han participado y la cantidad de artículos publicados (cerca de 800). Pero no es tan fácil descubrir cuáles son los temas que han interesado más frecuentemente a los autores (y lectores) de Latina ni si ha existido alguna evolución de los mismos. Es lo que nos ha llevado a planear la presente investigación, haciéndonos las siguientes preguntas: ¿Qué temas han sido abordados más frecuentemente? ¿Ha habido alguna evolución significativa año tras año (por ejemplo con el avance de Internet)? ¿Hay puntos comunes entre los diversos artículos? ¿Cuáles? La nuestra es, por lo tanto, una investigación exploratoria, que partió sin ninguna hipótesis definida, como ha de ocurrir muchas veces en el análisis de contenido. 2. Metodología Al plantearnos descubrir la temática de Revista Latina de Comunicación Social, nos vemos llevados a realizar algún tipo de Análisis de Contenido. No nos extenderemos aquí sobre los aspectos generales de la teoría correspondiente y sus avances históricos desde fines del siglo XIX y más especialmente desde Berelson y Lazarsfeld (1948), con múltiples textos al respecto, como los de Osgood (1957), Holsti (1969), Mucchielli (1974) y Krippendorf (1980) (ver López: 2002 y Marzal y Moreira: 2001). Los procedimientos que hemos utilizados son esencialmente estadísticos y gráficos y nos referiremos más adelante al origen y desarrollo del análisis automático (computacional) al que hemos recurrido. 2.1. Análisis estadístico El análisis estadístico comprende dos partes:
El análisis de coocurrencia aplicado en el campo del análisis semántico tiene la ventaja de no limitarse a la identificación y suma atomizada de los componentes significativos. Al contrario, le es propio reconocer una importancia fundamental a las relaciones entre dichos componentes, para lo cual considera siempre pares de componentes, midiendo la simultaneidad de su aparición en conjuntos significativos predeterminados. Típicamente, aquí, el conjunto significativo considerado es la oración (definida pragmáticamente como el conjunto de términos que se termina con un punto) y cada par de palabras en el interior de esta unidad gramatical constituye una coocurrencia. Así, si la oración se compone de seis palabras, existirán en ésta quince coocurrencias o pares de palabras. Por cierto el sistema es aplicable a cualquier conjunto con valor semántico, y no sólo a textos. Así, por ejemplo, Hudrisier lo utilizó en Francia para generar sistemas de clasificación de fotografías. Este procedimiento puede aplicarse a conjuntos de variadas dimensiones (dependiendo de la memoria RAM del ordenador utilizado), obteniendo como resultado una matriz de coocurrencia (tabla de doble entrada en que los conceptos se relacionan unos con otros). Como el tamaño de ésta crece rápidamente, corresponde al analista limitar el número de términos a considerar. Por ello se eliminan todas las palabras no significativas (artículos, pronombres, etc.) y se procede a establecer agrupaciones de términos que se consideraron como formas diferentes de representar un mismo concepto (campos conceptuales). Un campo conceptual se entiende «compuesto por unidades léxicas unidas por relaciones de naturaleza diversa en la lengua en uso, ya sea por relación semántica paradigmática, por asociaciones dadas por la cultura o por el conocimiento del mundo». (García: 1990: 103). En el presente caso, el software utilizado (Anatex3, ver Colle: 2005) permite definir la cantidad de campos conceptuales que se desee, cada uno a su vez compuesto del número de términos que sea necesario. Esto corresponde a la técnica de los "diccionarios" - como el clásico "Diccionario de Lasswell" y otros - utilizados por múltiples sistemas de análisis computacional del discurso (p.ej. el Minnesota Contextual Content Analysis, cfr. Litkoswski y McTavish: 2001). Después de analizar el superconjunto, se tendrá información acerca todas las coocurrencias reales, lo cual puede poner en evidencia procesos psicológicos subyacentes a la formulación del discurso, estrechamente vinculados al carácter semántico de la comunicación. Estas interrelaciones, además, al unirse entre sí conforman una red, que –al dibujarse– puede poner en evidencia sub-áreas y términos más importantes por su centralidad o por una función de unión entre sub-áreas. Esta técnica se origina en antiguas hipótesis del conductismo sobre el significado de las palabras, mejoradas luego con los aportes del llamado Modelo de Red Semántica de Collins y Quillian, establecido por dichos autores en 1969, pero corregido posteriormente de diversas maneras (cfr. Harley: 2008). El primer programa computacional de representación de una red semántica se debe a Richard H. Richens del Cambridge Language Research Unit (1956), sistema luego desarrollado por Robert F. Simmons en la System Development Corporation en los años 1960. Con la generalización del uso la computación en múltiples disciplinas, en los años ochenta y siguientes, se han multiplicado los trabajos de análisis computacional de redes semánticas. (cfr. Kleinnijenhuis: 2007) 2.2. Graficación El software Anatex que hemos utilizado proporciona las tablas de coocurrencia (tanto la matriz general como el listado de pares asociados) a partir del diccionario conceptual definido por el investigador pero no es capaz de graficar el mapa que representaría las interrelaciones. Para ello se recurrió a NetDraw, un software especializado de gráfica vectorial (Borgatti:2002). Dos procedimientos son de importancia aquí:
Es evidente que si se incluyen en un mapa todos los conceptos de un discurso, el mapa se hará ilegible y dejaremos de cumplir el objetivo de extraer la estructura organizadora y los subcampos semánticos medulares del mismo. Existe por lo tanto la necesidad de proceder por etapas, partiendo por las coocurrencias más frecuentes y construyendo varios grafos, correspondientes a diferentes niveles de frecuencia o bien, a la inversa, graficar toda la red y esconder los vínculos menos frecuentes. El software de análisis de redes, como NetDraw, procede generalmente de este modo, registrando la totalidad de la red, y ofrece procedimientos específicos para el análisis de ésta, como la selección sobre la base de atributos (como ciertas características de los integrantes o categorías que se hayan establecido previamente) y, en particular, del peso relativo de los vínculos (frecuencias) entre los nodos (integrantes de la red). Así, se pueden seleccionar umbrales de frecuencia que ponen en evidencia grupos, subgrupos y elementos tanto centrales como marginales (y, por lo tanto, poco significativos). 3. Etapas de análisis Corpus: En una primera etapa se seleccionaron las palabras clave de todos los artículos que las tenían, publicados desde enero de 1998 hasta diciembre de 2008. En los casos en que no había palabras clave se registraron como tales los títulos (lo cual es a veces menos preciso y menos completo). Fue el caso en las ediciones de enero a mayo de 1998, julio-agosto y diciembre 2001, todo 2002, 2003 y 2004 y enero-junio 2005. Tratamiento de las palabras clave: Se consideraron todas las palabras por separado excepto en el caso de nombres propios (de personas, organismos o publicaciones). Así, por ejemplo, para los efectos del análisis, «medio de comunicación» se compone de «medio» y «comunicación». Ésto es indispensable para un correcto análisis semántico de la temática. Al contrario, siendo nombres propios, «La Gaceta de Galicia» se transforma en «La-Gaceta-de-Galicia» y «Facultad de Ciencias de la Información» en «Facultad-de-Ciencias-de-la-Información». En los (escasos) casos en que las palabras clave estaban exclusivamente en otro idioma, se tradujeron al español. Las palabras clave (o títulos, en su defecto) de cada artículo fueron luego tratadas como un conjunto (como si fuese una oración) ya que es solo dentro de este conjunto que la coocurrencia tiene sentido. Los conjuntos de todos los artículos de un mismo año fueron agrupados como si formasen un sólo «discurso», a fin de poder estudiar la evolución histórica de la revista. Para cada uno de estos «discursos» se pasó entonces a la segunda etapa, consistente en un análisis automático de frecuencia de las palabras contenidas en el corpus completo (eliminando automáticamente las palabras vacías como artículos, preposiciones, pronombres, etc., conforme a lo expuesto en la Metodología). La lista obtenida sirvió básicamente para pasar a la confección del diccionario conceptual a utilizar en la siguiente fase. Posteriormente se condensó manualmente este listado procediendo a establecer agrupaciones de términos que se consideraron como formas diferentes de representar un mismo concepto (campos conceptuales). Se definió de este modo el Diccionario necesario para la siguiente etapa automática, el cual contiene 57 campos conceptuales (Ver Anexo 1), seleccionados en razón de la frecuencia de ocurrencia de los mismos (fr > 5, o sea haber aparecido en promedio al menos en la mitad de los años de publicación). Estos campos conceptuales son los «temas» de Latina que nos interesa conocer. Esta fase es obviamente la más subjetiva del trabajo, aunque se basa en algunos principios semánticos. (Véase el Anexo 1 para juzgar). Disponiendo de este Diccionario, se aplicó en forma automática a cada «discurso» (conjunto anual) un análisis estadístico de los campos presentes. Este análisis anual, cuyos resultados fueron vertidos a una hoja de cálculo, permitió así investigar la evolución histórica de la temática. Posteriormente se pasó al análisis de coocurrencia, consistente en crear una matriz en que se suman las coocurrencias de todos los campos conceptuales, la unidad de análisis siendo el conjunto de palabras clave correspondiente a cada artículo. En otras palabras, se registran todas las palabras del conjunto, se verifican cuales están en el «Diccionario» y se suma el caso en el registro del cruce de cada campo conceptual con los demás campos aludidos en la misma unidad analizada. Los resultados de esta etapa están constituídos por pares de campos conceptuales con su respectiva frecuencia de coocurrencia (Ver ejemplos más adelante). Los resultados, correspondientes a cada año, se pasaron también a una hoja de cálculo a fin de poder compararlos y, con la sumatoria, obtener los resultados para todo el período considerado. Los cálculos se realizaron utilizando el software ANATEX, una aplicación desarrollada originalmente en la Pontificia Universidad Católica de Chile (en 1988 para la plataforma Macintosh y actualizada por este autor en 2005 para el sistema operativo Linux), destinada a facilitar operaciones vinculadas al análisis de textos, tanto en el campo del análisis de contenido como en lingüística y otras áreas vinculadas a las anteriores como la hermenéutica y la exégesis. Realizados los dos tipos de operaciones de cálculo necesarios en la presente investigación -primero la estadística de palabras y luego la estadística de campos conceptuales coocurrentes- pasamos a la graficación utilizando NetDraw (Borgatti, 2002). 4. Resultados Hemos registrado más de 1.700 términos (palabras claves o palabras significativas en títulos). Las diez más frecuentes fueron las siguientes ('España' y 'nuevo' tienen la misma frecuencia): Tabla 1. Términos más frecuentes
A partir de estas palabras, reagrupándolas, hemos confeccionado la lista de temas (campos conceptuales) abordados. Ya hemos señalado que hemos limitado esta lista a los temas que han aparecido en promedio al menos en el 50% de los años de publicación (frecuencia superior a 5), lo cual era indispensable debido a la enorme cantidad de temas que aparecieron solamente una o dos veces. Sin embargo, es indispensable recordar que los temas consisten, en múltiples casos, en la reagrupación de múltiples términos. Así, por ejemplo, en el tema «educación» reagrupamos 12 términos asociados que aparecieron muchas veces con una bajísima frecuencia:
Al contrario, ante la -esperable- alta cobertura del tema del periodismo, preferimos subdividirlo en varios subtemas:
4.2. Temas A partir del diccionario definido, hemos obtenido la siguiente estadística de frecuencia de los temas (limitada aquí a los que aparecieron más de 10 veces): Tabla 2. Temas más frecuentes
* Estos porcentajes se han establecido en base al total de temas citados a diferencia de la tabla del Anexo 2, donde los porcentajes corresponden al número de artículos. (Se incluyen aquí solamente los porcentajes >1) Los cuatro primeros temas son lógicamente los más genéricos, ligados a la temática global de la revista, siendo el periodismo el dominante (prensa+periodismo=313, o sea aproximadamente 28,5 veces por año). Pasando luego a temas más específicos, vemos que la televisión ha sido el medio que ha acaparado más la atención (113, seguido de Internet (Internet+web=107, lo cual se acerca mucho al tema de la televisión), ocupando también una importante posición países como España, Argentina y México (citados por su nombre o su gentilicio). Las otras naciones más frecuentemente citadas han sido Costa-Rica, Venezuela, Canarias y Brasil. Como medio de comunicación específico, solo ha aparecido más de cinco veces el diario El País (14). Es interesante ver que la ética también ha concitado frecuentemente el interés (50). Si unimos los dos temas asociados a la imagen (excluyendo la televisión), iconografía e infografía, obtenemos también una alta representación (70). El gráfico que sigue representa visualmente la Tabla 2, dando una mejor idea de la variación proporcional de las frecuencias: Permite ver con qué «rapidez» bajan las altas frecuencias, mientras se multiplican las bajas, lo cual anticipa el fenómeno que encontraremos a analizar graficamente las interrelaciones entre los temas. Gráfico 1: Temas por frecuencia
Si observamos la distribución de los temas a través del tiempo (año por año) y la ponderamos de acuerdo al número de artículos registrados cada año –para poder estudiar la evolución histórica– obtenemos una distribución que registra numerosas variaciones. La comunicación, la información, los medios, Internet y la ética han sido, proporcionalmente, más citados en los tres o cuatro últimos años. Pero no es posible observar una evolución sistemática de los intereses: las variaciones anuales son muy irregulares y las cifras, además, no son siempre comparables por cuanto durante algunos años no hubo palabras clave y operamos con los titulares (Ver Anexo 2). Tampoco es posible hacer aquí deducción alguna acerca de la influencia que pudo haber tenido el paso a la «Segunda Época» (2006) sobre la temática, debido a las variaciones anteriores. Nos interesaba particularmente lo ocurrido con el tema general de las «Nuevas Tecnologías». Ésto implica, de acuerdo a nuestro Diccionario, considerar los temas específicos Ciber, Digital, Internet, Web y el par asociado Nuevo+Tecnología. La suma anual y su transformación en porcentajes de artículos que contienen estos diferentes campos conceptuales se muestra en la siguiente tabla: Tabla 3. Nuevas Tecnologías
Tómese en cuenta que las frecuencias netas no indican el número de artículos, sino la suma de las frecuencias de los temas, varios de éstos pudiendo aparecer como descriptores de un mismo artículo. La misma distorsión se presenta al calcular la poderación por la cantidad de artículos (por lo cual también la frecuencia ponderada supera 100 en 2008). Gráfico 2: Evolución del interés por las NTICS (ponderado; según Tabla 3)
4.3. Coocurrencia de temas Dado que la descripción de los artículos implicaba el uso de mútiples términos, era importante analizar la interrelación de los temas señalados en cada caso. Es lo que se obtiene mediante el análisis de coocurrencia, el que arrojó los siguientes resultados a nivel general y por frecuencia decreciente (Tabla completa en Anexo ): Tabla 4. Coocurrencias más frecuentes
Los cuatro primeros casos muestran asociaciones bastante obvias. Sin embargo, el primer caso no significa necesariamente «medio de comunicación»: la asociación significa solamente que los dos temas aparecen en un mismo artículo, sea unidos con la preposición «de» sea de otra forma. Lo mismo vale para «comunicación social» y los otros pares. Es de esta forma que deben interpretarse todos los resultados relativos a la coocurrencia. La principal observación es que la repetición de los mismos pares asociados es bajísima en comparación con el número de artículos publicados, lo cual es un indicio de la alta diversidad de los mismos. Son 239 los pares coocurrentes que aparecen una sola vez y 89 los que aparecen dos veces. Debemos reconocer que hemos sido sorprendido por este resultado, esperando coocurrencias más frecuentes. Se explica –solo en parte– por el importante número de artículos que no cuenta con palabras clave: en estos casos el número de términos correspondientes al diccionario de campos conceptuales (temas) es mucho menor y, por lo tanto, las coocurrencias muy escasas. Las relaciones se observan mejor cuando se construye, gráficamente, la red de interrelaciones, siempre que se limiten los arcos (líneas que muestran las relaciones) en función de la frecuencia, aquí todos los casos con F>4 (el gráfico con frecuencias inferiores resulta ilegible e ininterpretable): Gráfico 3: Interrelaciones temáticas (>4) Gráfico 4: Interrelaciones temáticas mayores (>7) Nótese la presencia de Argentina, más ligada a temas que los demás países que aún permanecen en la red (Brasil y Costa Rica), a pesar de que España y México son individualmente más frecuentes: para esos dos países (o nacionalidades) los temas asociados son más variados y, por lo tanto, las coocurrencias menores. Varios otros aspectos pueden notarse, aunque recordando siempre que las frecuencias son bajas, como el interés por la educación en Canarias (Gráfico 3) o la ética en la comunicación. 4.4. Observaciones Algunos autores han incluído en sus palabras clave términos como «Investigación» o, como lo hemos hecho también aquí, «Análisis de contenido», lo cual no ha sido una práctica común. No nos parece obvio que el tipo de trabajo o la metodología utilizada deban mencionarse en las palabras clave, pero la ausencia de una norma y de una nomenclatura preestablecida no facilita una solución. Otro problema es la falta de normalización de las palabras clave utilizadas, ya que son inventadas por los autores, lo cual lleva a una importante dispersión semántica. Era probablemente muy difícil establecer un listado tipo antes de poner en marcha la revista y las palabras clave se agregaron ya avanzada su publicación, aunque no en toda su historia. Gracias a la presente investigación, sería posible avanzar eventualmente hacia una normalización, sea utilizando una mera Lista de Autoridades sea un Tesauro (lo cual es más complejo), donde los autores o editores podrían escoger los términos, pero ello depende obviamente de una decisión editorial. 5. Conclusión El proyecto original contemplaba solamente el análisis de las palabras clave, pero el número de artículos que no contaba con ellas resultó ser demasiado alto para ignorar éstos. Por ello utilizamos los títulos en los casos en que no había palabras clave, prefiriendo esta fuente mixta al uso exclusivo de los títulos, menos detallados y menos precisos. Como era de esperar, los resultados indican que los artículos publicados son altamente coherentes con los objetivos de la revista. Los cuatro temas más genéricos son los más frecuentes, cubriendo el 30% de los términos definitorios utilizados por los autores. Aunque podría parecer obvio que se destaquen de este modo, también se podría estimar que indican una tendencia demasiado elevada de los autores por incluir términos que poco precisan. En síntesis, en los once años transcurridos, la atención se ha dirigido principalmente hacia la prensa y el periodismo, la televisión y las nuevas tecnologías digitales (Internet). También ha habido un interesante grupo de artículos relativos a la expresión gráfica. Se destacan España, Argentina y México como los países más aludidos siendo, probablemente, los países de donde se han recibido más artículos. 6. Bibliografía Borgatti, S.P., 2002: NetDraw: Graph Visualization Software, Harvard: Analytic Technologies. Anexo 1: Diccionario Anexo 2: Porcentajes de artículos por tema
* Por efecto de agregación de términos en los campos conceptuales, es perfectamente posible que le total sea superior a 100. Anexo 3. Coocurrencias (Frecuencias >1)
|
|