Enfermería virtual llega a su fin en el ámbito estadístico, al menos enfocado a la asignatura de la escuela. Ha sido un proyecto bastante complicado para mí y una tarea que no me proporcionaba ningún tipo de motivación. La estadística, los test de hipótesis, me resultan muy interesantes, entretenidos e incluso divertidos. Sin embargo, en un principio toda la teoría impartida en clase no me llamaba la atención lo más mínimo. A pesar de ello, conforme hemos ido trabajando y poniendo en práctica cada uno de los conocimientos que nuestros profesores han tratado de introducir en nuestras cabezas, la estadística enfocada a la enfermería ha ido despertando en mí un cierto grado de interés. Durante el estudio e investigación que mis compañeras y yo realizamos sobre el método de alimentación del Baby Led Weaning, debo decir que la estadística aparecía en las peores de mis pesadillas. No obstante, cuando el estudio finalizó, cuando sacamos conclusiones y vimos resultados, entendí la utilidad de esta rama. La satisfacción de un trabajo bien hecho, de conseguir resultados, de llegar a conclusiones válidas y argumentadas, supera con creces al tiempo invertido, a las dificultades encontradas y al trabajo realizado. Sinceramente, no se qué me depara el futuro, no se si seré matrona, enfermera pediátrica, quizás enfermera de un equipo de emergencias... lo que sí se es que sea como sea, la asignatura ETICs ha despertado en mí un interés que espero me lleve en un futuro a ser también enfermera investigadora, a estudiar distintos campos de interés sanitario y sobre todo enfermero, a ir más allá, a curar y cuidar y personas, y a innovar en sus cuidados y tratamientos.
CONTRASTE DE HIPÓTESIS Los test de hipótesis son empleados para el control de errores aleatorios. Son las herramientas que se usan dentro de la estadística para resolver las dudas que se plantean. Estos test contrastan una hipótesis nula, que es la que establece que entre las variables estudiadas no existen relación. Posteriormente, con los resultados, la aceptaremos o la rechazaremos para aceptar la hipótesis alternativa. ERRORES DE HIPÓTESIS El error es la probabilidad que tengo de equivocarme al rechazar o aceptar mi inicial hipótesis nula. El error más pequeño en la rama de la sanidad al que podemos rechazar nuestra hipótesis nula es el error p y corresponde al 5%. Cuando el resultado de nuestros test nos de un error menor al 5% (menor de 0.05) rechazaremos la hipótesis nula, aceptando así una relación entre las variables. Por el contrario, cuando el error está por encima de 0.05, aceptaremos la hipótesis nula. Tenemos dos tipos de errores:
Tipo alfa: es muy grave, pues rechazamos la hipótesis nula y con ello la relación entre las palabras, cuando sí que existe dicha relación.
Tipo beta: es un error leve, pues aceptamos la relación entre las variables cuando no la hay.
TEST DEL CHI CUADRADO
Este test lo empleamos cuando comparamos dos variables cuantitativas.
TEST 'T DE STUDENT'
Compara una variable cualitativa nominal dicotómica con una cuantitativa.
TEST DE ANOVA
Compara una variable cuantitativa con una cualitativa nominal policotómica.
La estadística inferencial abarca los métodos y procedimientos que han sido empleados para deducir ciertas propiedades de una población, a partir de una muestra de la misma.
A los procedimientos que nos permiten elegir muestras que reflejen las características de la población, los llamamos 'técnicas de muestreo'.
Al trabajar con una muestra, debemos aceptar siempre cierto error al que llamamos error aleatorio.
ERROR ESTÁNDAR
El error estándar cuantifica las oscilaciones de la media muestral, es decir, cuánto se alejan x variables de la media. Mientras mas pequeño sea el error mas cerca del valor real estaremos.
Para media
Para proporción
Teorema central del límite
A pesar de que lo ideal sería que existiese una distribución normal, esto no es siempre así.
Existe un teorema que dice que si se cogen varias muestras y se le aplica la media, las medias de las medias de las muestras se van a agrupar de manera normal. Porque va cogiendo valores aislados y cada vez lo va centrando mas y cada vez se va concentrando en la cota media. A mas población y cada vez mas medias, la desviación típica y el error estándar cada vez se harán mas pequeño. Cada vez tendera mas al centro. La distribución sigue una distribución normal con un error estándar que cada vez se acerca mas a la desviación típica.
Si sigue una distribución normal, 1S abarca un 68,26% de las observaciones, 2S un 95,45% de las observaciones y 3S un 99%.
INTERVALO DE CONFIANZA
Los intervalos de confianza son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio). Se trata de un par de números tales que, con un nivel de confianza determinados, podemos asegurar que el valor del parámetro es mayor que el límite inferior y menor que el superior.
Al igual que en el caso del error relativo, dependerá de si lo calculamos para media o proporción:
Z es un valor que depende del nivel de confianza y del error máximo admisible. Por lo tanto, Z tiene distintos valores según el nivel de confianza.
TIPOS DE MUESTREO
Probabilistico:Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra. Es el método que consiste en extraer una parte de una población o universo, de tal forma que todas las muestras posibles de tamaño fijo tengan la misma posibilidad de ser seleccionados.
Simple: Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra.
Sistemático: Similar al aleatorio simple, donde cada unidad del universo tiene la misma probabilidad de ser seleccionado. Sea 5 el intervalo para la selección de cada unidad muestra: Cada 5 personas se selecciona: 5, 10, 15... y así sucesivamente hasta llegar a 100.
Estratificado: Se caracteriza por la subdivisión de la pobalción en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados.
Conglomerado:Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. Las inferencias que se hacen en una muestra conglomerada no son confiables como las que se obtienen en un estudio hecho por muestreo aleatorio.
Muestra no probabilística: Me interesa un grupo concreto. Personas que están expuestas a algo concreto, si nos vamos intencionadamente a esas personas excluimos a las que nunca han estado expuesta al factor.
Por cuotas:quiero tener mitad de hombre y mujer, esto es una cuota: 50% y 50%. Las poblaciones no siempre son 50 y 50. El ejemplo de los sesgos: sesgo de selección porque no hay el mismo numero de hombres (esto no es un sesgo) sino que intencionadamente se ha escogido así.
Accidental:paciente con tensión, se apunta. Cogemos a pacientes que por casualidad ese dia acudieron al centro de salud (no todas tienen la misma probablidad de participar en el estudio, sino solo aquellas que ese dia fueron al centro de salud).
Por conveniencia o intencional: En el que el investigado decide según sus objetivos los elementos que integraran la muestra, considerando las unidades "típicas" de la población que se desea conocer en función de nuestro interés, nuestra accesibilidad...
TAMAÑO MUESTRAL
El tamaño de la muestra va a depender del error estándar, de la mínima diferencia entre los grupos de comparación, la variabilidad de la variable a estudiar (varianza) y del tamaño de la población de estudio. Se diferencia también dependiendo de si se calcula para una media o una proporción.
Cálculo del tamaño de una muestra para una media:
Si tras esta operación se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.
Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula:
n´=n/1+(n/N)
Cálculo del tamaño de una muestra para proporción:
En este último seminario, tanto de la asignatura como del primer curso de enfermería, hemos expuesto al fin los proyectos de investigación. El tema sobre el que mi grupo y yo hemos investigado ha sido la alimentación complementaria a la lactancia, comparando el método convencional de papillas y purés con el novedoso método del Baby Led Weaning (destete guiado por el bebé), el cual comienza a utilizarse a partir de los 6 meses de edad del neonato.
Tras la recogida y el análisis de los datos gracias al uso del programa informático Epi Info y de los test estadísticos de contraste de hipótesis,podemos destacar dentro de las conclusiones finales:
En primer lugar se concluye que el método del Baby Led Weaning contribuye a un mantenimiento del índice de masa corporal del neonato dentro de los valores normales establecidos por la OMS, mientras que los neonatos alimentados con el método convencional tienen un riesgo de sobrepeso mayor.
El novedoso método del Baby Led Weaning comenzó con varios problemas de difusión y aceptación en España, pero poco a poco va ganando en popularidad y muchos padres están satisfechos con sus beneficios.
En general, el seminario ha sido bastante interesante tanto por la exposición de nuestro proyecto como por la de los otros grupos, pues todos han sido muy buenos estudios y han resultado de interés.
Estos seminarios han sido probablemente los más útiles que hemos tenido a lo largo de este primer curso de enfermería. Han estado dedicados a la resolución de cualquier tipo de dudas. En primer lugar el profesor nos ha explicado los fallos de nuestros protocolos de investigación con el fin de corregirlos de cara al proyecto final. Por otra parte nos ha resuelto las dudas sobre el uso del programa Epi Info, pues tal y como suponíamos, se nos atraganta bastante. Por último, se han resuelto dudas sobre la asignatura en general, tanto problemas de contraste de hipótesis como teoría en sí. Sinceramente, las explicaciones del profesor han sido de vital importancia. Como conclusión de ambos seminarios no puedo sacar otra que el alivio, pues gracias a ambos mis conocimientos se han ampliado mucho más allá de lo que estaban cuando comenzaron. Por ello pienso que sí, han sido los más útiles del todo el curso, con ellos la estadística ha perdido parte de su dificultad.
Este seminario se ha dividido en dos partes. La primera de ellas ha estado dedicada a la exposición de los trabajos que se han hecho por grupos, que consistían en la búsqueda de datos mediante las herramientas que se nos explicaron en el seminario anterior. Mi grupo ha tenido que investigar sobre qué tratamiento es mejor para tratar las úlceras, si el uso de los apósitos de hidrocoloides o el de azúcar no estéril. Nuestra pregunta PICO (pregunta en la que se engloba población de estudio, intervención que se realiza, la comparación que se va a estudiar y los objetivos) ha sido:
'En población anciana encamada y dependiente, ¿qué tratamiento, apósitos de hidrocoloides o azúcar no estéril, es más eficaz para favorecer la cicatrización y prevenir las posibles infecciones?'
Tras poner en práctica los nuevos conocimientos adquiridos en el seminario anterior sobre las bases de datos, los tesauros y los booleanos, hemos podido concluir y exponer a nuestros compañeros que ambos tienen propiedades para cicatrización y desinfección
de las úlceras por presión. La diferencia es que el tratamiento con azúcar es mucho más
duradero y el de hidrocoloides es más potente, menos duradero.
La segunda parte del seminario ha consistido en la explicación del programa Epi Info, el cual usaremos para analizar los datos recogidos durante el estudio que realizaremos para el trabajo de investigación de la asignatura. Este programa consiste en la realización de un cuestionario en el que meter los datos que se han recogidos de los distintos sujetos encuestados, para que automáticamente sean analizados mediante tablas de frecuencia y gráficas. Además, se pueden realizar test de contraste de hipótesis en el mismo programa señalando las variables que se desean emplear.
Creo que va a resultar una tarea bastante complicada, puesto que nuestros conocimientos tanto del programa como de informática en general, son bastante escasos. A pesar de ello pienso que con mucha paciencia y constancia, conseguiremos llevar a cabo el trabajo.
Aquí dejo un vídeo de como instalar el programa Epi Info, por si en algún momento alguien decide adentrarse en el mundo de la investigación; ¡es muy útil!
El primer seminario de la asignatura ETICs ha estado enfocado a la explicación de dicha asignatura y de los temas que se tratarán en los demás seminarios, así como las reglas que debemos seguir para elaborar este blog. Con este fin, el profesor nos ha planteado una serie de enlaces donde adquirir información para hacer el blog lo mejor y más sofisticado posible. Por otra parte, el otro tema tratado en el seminario ha sido el de la elaboración de un protocolo de investigación, basado en el futuro trabajo de investigación que debemos realizar. Para el desarrollo del protocolo, el profesor nos ha explicado y mostrado las distintas herramientas en las que nos podremos apoyar para la búsqueda de datos. En estas herramientas encontramos las distintas bases de datos que utilizaremos para el estudio y la recogida de información. Entre ellas encontramos PUBMED, SCOPUS, CINAHL, etc. Para acceder a ellas lo haremos a través de la biblioteca virtual de la Universidad de Sevilla:
Gracias a estas bases de datos tenemos fuentes realmente fiables de información en la que basarnos sin riesgo a usar datos erróneos. El problema se encuentra en que el nivel de inglés y de lenguaje científico es bastante bajo. Para ello tenemos los TESAUROS, que nos traducirán los conceptos que queramos tanto al inglés como al lenguaje técnico. Estos son:
Esta ha sido la información que se nos ha proporcionado. Sin embargo, a pesar de conocer las bases de datos y como llegar a ellas, debemos aprender a realizar una búsqueda concreta y específica. Para ello usamos los BOOLEANOS (donde los más comunes son AND, OR, NOT), que son palabras que nos van a limitar la búsqueda. Deberemos usarlas en las bases de datos empleadas y con los términos que hemos buscado en los tesauros. De esta manera reduciremos muchísimo la búsqueda de información.
Con todo esto, seleccionaremos los artículos que más nos convengan y podremos comenzar a realizar el protocolo de investigación. Será un trabajo laborioso y en el que tendremos que invertir mucho tiempo, sobre todo debido a la falta de conocimientos informáticos y de inglés, pero con constancia se conseguirá hacer correctamente.
Destacamos en primer lugar la diferencia entre parámetro y estadístico: El parámetro se refiere a la población y el estadístico se refiere a la muestra.
1. MEDIDAS DE TENDENCIA CENTRAL
· - Media aritmética o MEDIA(x): Sumamos valores y los dividimos por la muestra total de individuos. Se calcula para variables cuantitativas. Es el centro aritmético de nuestro dato.
Es, por tanto, el sumatorio de todas las medidas (x) entre (n) toda la población.
Cuando los datos son agrupados se usa la marca de clase: es la media del intervalo pero en este caso se multiplica por la frecuencia de ese intervalo. Se suma todo y se divide por la población total.
· - Media ponderada: igual que la anterior pero para datos agrupados en intervalos.
Problemas que presenta la media aritmética: Al utilizar todos los valores no encontramos valores muy extremos. O sea, si estamos midiendo la edad media de una clase y ronda los 18, 19 años y tenemos una persona con 70 años, este valor extremo aislado hace que la media suba pero no es real.
Existe una desviación típica o estándar que se acompaña de la media y es el +/-.
Alternativo a esto: la mediana.
-Mediana: Valore medio que agrupa la variable, con un 50% a cada lado. La mediana es siempre el valor del medio. Por ello hay que ordenar los datos de menor a mayor.
-Moda: Es el valor que más se repite. Si hay dos modas se llama muestra bimodal. Si hay más de dos se llama multimodal. Por ejemplo, en la serie de números 60,90,50,60,40, el valor que más se repite es el 60. Este ejemplo, concretamente, es bimodal.
2. MEDIDAS DE POSICIÓN
Valores de la distribución que la dividen en partes iguales, en intervalos que comprenden el mismo número de valores. Los más usados son:
Percertiles. Se divide en 100 partes
Deciles. Se divide en 10 partes.
Cuartiles. Se divide en 4 partes.
3. MEDIDAS DE DISPERSIÓN
Existen porque la información aportada por la dependencia central es limitada.
Rango o recorrido:diferencia entre el mayor valor de la muestra y el menor. Da poca información porque solo nos da el recorrido pero no sabemos como se agrupan los datos.
|xn-x1|
Desviación media: Es la media aritmética de las distancias de cada observador con respecto a la media de la muestra. Es decir, mide cuanto se aleja de la media aritmética cada observación. Es muy similar a la desviación típica.
Desviación típica:Desviación con respecto de la media. Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Aglutinamos un porcentaje de la población (habrá algunos que se me aíslen).
Variancia:lo mismo que la desviación típica pero en vez de hacer la raíz cuadrada se pasa al cuadrado del sumatorio. S2 en vez de raíz cuadrada de x.
Recorrido intercuartilico:diferencia entre el tercer y el primer cuartil. Si yo tengo el valor ordenado de mayor a menor entre 100 valores, seria el 75 menos el 25.
|Q3-Q1|
Coeficiente de variación: no tiene unidad. Es adimensional. Medida de dispersión relativa ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida. Formula: desviación típica entre la media.
4. DISTRIBUCIONES NORMALES
Cabe hacer mención también a las distribuciones normales, o también llamada distribución de Gauss. Esto es una distribución de probabilidad de una variable continua cuya gráfica tiene forma de campana. Es simétrica, y por lo tanto en ella coinciden la media, la moda y la mediana.
5. SIMETRÍA Y CURTOSIS
La asimetría nos permite identificar si los datos se distribuyen de forma uniforme alrededor de un punto central
Y la curtosis es una medida que nos permite determinar el grado de concentración que presentan valores en la región central de la distribución.
EJEMPLOS MEDIA, MEDIANA, MODA, MEDIDAS DE POSICIÓN, DESVIACIÓN TÍPICA
1. ESTADÍSTICA Estadística se le llama al conjunto de conocimientos que nos proporciona aprendizaje desde la experiencia, en forma de números que provienen de medias que nos muestran variaciones entre distintos individuos. Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. La estadística estudia la variabilidad, la medición de signos y síntomas. Para distintas variables existen distintos métodos de medición. 2. ESCALA DE MEDIDA
ESCALA NOMINAL
El nivel más inferior de medida. Solo se puede comprobar si las variables o características son iguales o diferentes. Ej: género, raza.
ESCALA ORDINARIA
En la mediación ordinal dadas dos o más modalidad de una variable. Es
posible:
-Establecer si son iguales o diferentes.
-Si son distintas, determinar cuál de ellas es
mayor.
Por tanto los números expresan relaciones de: igualdad, desigualdad y
orden.
Ejemplo: escala de dolor (nulo, leve, medio, alto, máximo). El problema es que carecemos de suficiente información al no poder situar nada entre dos de las opciones, por ejemplo, si el dolor no es medio pero tampoco es alto, sino intermedio de ambos. Además, tan solo se puede establecer un orden en una escala de mayor a menor y viceversa.
ESCALA DE INTERVALO
Presenta las características de las escalas anteriores:
- Identidad y orden.
- El requerimiento de que los intervalos iguales representan distancias equivalentes (entre nulo y leve hay la 'misma distancia' que entre leve y medio).
- El 0 (pues la escala también puede ser numérica) representa valor absoluto.
- No se pueden sacar razones o proporciones.
- En ella se pueden aplicar estadística como mediana, desviaciones y correlación.
ESCALA DE RAZÓN
Es el nivel más alto de medición. Presenta las características propias de las tres escalas anteriores (identidad, orden y distancias equivalentes entre intervalos). Además, se darán como válidas las relaciones de identidad más orden más intervalos equivalentes, por lo que en dos números atribuidos a dos modalidades se admitirán las relaciones de identidad, orden, las
operaciones de suma, resta, multiplicación y división.
3. TIPOS DE VARIABLES
CUALITATIVAS
Son propiedades que no se pueden medir. Pueden ser: - Ordinales: establecen un orden. Por ejemplo, grado de satisfacción respecto a la actuación del enfermero: nada satisfecho, poco satisfecho, satisfecho, muy satisfecho.
- Nominales: se miden con escalas nominales. No hay diferencia de importancia. Estas a su vez se dividen en dicotómicas (solo 2 niveles o categorías como las respuestas de sí/no, masculino/femenino) o policotómicas (más de dos categorías, como por ejemplo el estado civil, la religión). Las categorías se deben construir en base a los criterios de exhaustividad (los sujetos pueden ser clasificados en algún punto de la escala) y exclusividad (solo se pueden incluir en una de las categorías).
CUANTITATIVAS
Se pueden medir en términos numéricos. Pueden ser:
- Discretas: solo se puede tomar un número finito de valores pues son números enteros. Ejemplo: nº de hijos. - Continuas: se puede elegir cualquier valor dentro de un rango. Ejemplo: edad (15 años y medio)
4. VARIABLES: REPRESENTACIÓN DE DATOS
Para la representación de datos se usan las tablas de frecuencia, representando las frecuencias en columnas y las categorías en filas. Requisitos:
- - Son auto-explicativas.
- - Son sencillas y de fácil comprensión.
- - Tienen título, breve y claro.
- - Indican lugar, fecha y fuente de información.
- - Incluye las unidades de medida en cada cabecera.
- - Indican la base de las medidas relativas.
- - Hacen explicitas las abreviaturas.
Se deberán recoger en esta tabla los valores de frecuencia absoluta y frecuencia relativa, explicadas en entradas anteriores.
EJEMPLO
5. VARIABLES CONTINUAS: REPRESENTACIÓN DE DATOS. Para la representación de estas variables se debe:
- - Definir los intervalos.
- - Definir los extremos de los intervalos, procurando
que esos extremos sean exhaustivos (lo que pasa con la edad en el apartado
anterior)
- - Definir la amplitud o distancia entre los
extremos. (Distancia entre los intervalos)
- Cálcular la marca de clase de cada intervalo. Media
entre los dos valores extremos del intervalo.
La manera de hacerlo sería:
- Calcular el recorrido (diferencia entre el valor más alto y el más bajo).
- Calcular el intervalo haciendo la raíz cuadrada del número de datos observados.
- Calcular la amplitud de cada intervalo dividiendo el recorrido por el número de intervalos.
- Por último, se debe calcular la marca de clase de cada intervalo.
6. REPRESENTACIÓN GRÁFICA
Es una forma rápida de representar frecuencias, representando ideas con barras, histogramas, etc. Ofrecen orientación visual a modo de aclaración. Deben ser visualmente claros, descritos, representar conclusiones y evitar gráficos confusos.
Las relaciones locales más frecuentes son:
DIAGRAMA DE BARRA
Para medir una variable cualitativa, nominal y policotómica.
HISTOGRAMAS Y POLÍGONOS DE FRECUENCIA
Histograma: es igual que el anterior solo que se usa para variables continuas. Si la
amplitud de intervalo es la misma, elevaremos columnas unidas a la altura de la frecuencia correspondiente. Si
la amplitud del intervalo es diferente, el área del rectángulo columna será
proporcional a la frecuencia representada.
7. GRÁFICOS
DE TRONCO Y HOJAS
Expresa variables cuantitativas continuas.
DE SECTORES
Para variables cualitativas con pocas categorías como las dicotómicas o las policotómicas con pocas categorías.