Trabajos experimentales IV. Cuestión de confianza, no de fe.

En este artículo

MVZ, EPAP, MC. Raúl Águila.

ENLACE.

En la parte III de esta serie de artículos, expuse diferentes modelos de diseño experimental: a) Pruebas de secuestrantes de micotoxinas, b) Pruebas con enzimas exógenas, c) Pruebas de aditivos sustitutos de antibióticos promotores de crecimiento, d) Pruebas de eficacia clínica de antibióticos; pues bien, quiero volver a este último modelo porque me faltó una precisión relevante.

Recordemos que, en las pruebas de eficacia de antibióticos ante enfermedades de cerdos (o aves), bajo condiciones controladas, se busca reproducir la enfermedad mediante inoculación de la bacteria; esto hace necesario los siguientes controles: 1) Doble negativo (animales sin enfermedad, sin antibiótico), es el testigo del comportamiento de cerdos sanos; 2) Mixto (con enfermedad, sin antibiótico), los animales deben enfermar claramente, es la garantía de que se pudo reproducir la enfermedad, 3) Doble positivo (con enfermedad y con antibiótico), puede haber variantes de este grupo donde, lo que varía es la dosis del antibiótico; y con la seguridad de que los animales están enfermos, se verá cuál es la dosis de antibiótico que es eficaz para contrarrestar la enfermedad clínica (según grados de signos clínicos, lesiones, mortalidad, etcétera).

Objetivo y diseño de una prueba clínica controlada.

Una prueba debe tener un número limitado de objetivos, generalmente uno primario y posiblemente dos o tres objetivos secundarios que deben estar claramente establecidos (Dewey 1999). Aclaro que esto lo he observado en reportes experimentales científicos.

Por ejemplo, una prueba que examina el uso de un antibiótico para controlar neumonía en cerdos en crecimiento, podría tener como objetivo principal, reducir la mortalidad y, como objetivos secundarios, los investigadores pueden estar interesados en mejorar la tasa de crecimiento y reducir la variación de peso. Esto es lo importante: el diseño de la prueba probablemente será diferente si el objetivo principal fuera la reducción de la variación de peso.

CONFIANZA DE EJECUCIÓN DE LA PRUEBA.

Tener seguridad de que las conclusiones son válidas es el objetivo primordial de un trabajo experimental, ya si los resultados son positivos o negativos (funcionó o no lo que se probó), es cuestión secundaria, ambos resultados son igualmente valiosos.

Los trabajos experimentales no son “actos de fe”, son estructuras de confianza que construyen la certeza de que los resultados se deben exclusivamente al factor evaluado.

Más adelante hablaré de la confianza estadística, ésta da validez a las diferencias aritméticas de los promedios de cada tratamiento, pero un trabajo sesgado podría resultar con muy buena confianza estadística.

Un trabajo bien hecho se demuestra en la sección de materiales y métodos, así como con el modelo experimental; sin embargo, es muy probable que no seamos expertos en el tema, por eso es recomendable leer trabajos científicos revisados por un jurado calificado que ha aprobado su publicación. Por esta razón los “Abstracts” de trabajos no son válidos como referencias científicas pues, solo muestran los resultados; claro, su justificación es llamar rápidamente la atención del lector para que busque la publicación completa (con materiales y métodos) y analice.

Resultados relativos.

Cuando nos muestran que la prueba demostró mejoras en ciertos parámetros productivos se debe revisar el contexto de dicha mejora, por ejemplo: en una granja sana, con un aditivo alimenticio se logró 1 lechón destetado más por parto (comparado con el control), pero omiten decir que el grupo control tuvo 8.5 destetados y el tratamiento 9.5 destetados, hoy en día, en granjas sanas el potencial es mucho mayor (más de 10.5), esto se consigue por muchas vías; de hecho, 8.5 y 9.5 son bajos; sin el aditivo se debe conseguir un mayor número de destetados. Recuerdo el caso de un aditivo coreano ofrecido en México hace unos 17 años que, demostraba la disminución del Espesor de la Grasa Dorsal (EGD) de 20 a 18 mm a los 100 kg, el trabajo experimental estaba realizado en Corea, pero en esa época en México, el estándar, gracias a las líneas genéticas comerciales, el EGD típico a 100 kg, era ya de 16 mm (es que en ese país todavía tenían cerdos muy grasosos y además ya usábamos ractopamina).

“Salir tablas”.

Se hacen experimentos que tienen por objetivo demostrar que el aditivo da los mismos resultados que el control (otro aditivo), es decir, “no hay diferencias”; bajo estas circunstancias, la meta es demostrar, por ejemplo, que un aditivo puede sustituir a un antibiótico promotor de crecimiento que ya está prohibido, o que un nuevo producto da los mismos resultados que otro, pero el nuevo es más rentable (una enzima por otra).

Cuidado, esto es riesgoso porque, si no se cuida cerrar la variación de peso de ambos grupos, es muy probable que no se encuentren diferencias estadísticas aun cuando las diferencias aritméticas entre los tratamientos sean grandes. En el cuadro siguiente pongo un caso hipotético y explico. Se reporta que el tratamiento A tuvo una Ganancia Diaria Promedio de 0.650 kg y el B 0.750 kg, el análisis estadístico dice que el valor de probabilidad es mayor a 0.05; por tanto, no hay diferencia entre los promedios, o sea, “los dos productos funcionan igual”. “Lo que se buscaba” el nuevo aditivo.

Pero: la diferencia entre las dos GDP es de 100 gramos, una diferencia del 14%, es mucho. Si analizamos los Coeficientes de Variación (CV) de la GDP (generalmente no se reportan) vemos que son del 25%, es mucha la variación (en un trabajo con cerdos debería ser del 10%, esto depende mucho de la variación de peso de inicio (seguro no se hizo bien la prueba).

Trabajos experimentales IV. Cuestión de confianza, no de fe. trabajo experimental 4
El valor P indica que ¡No hay diferencias!

Para el grupo “A” (control), la GDP tiene un promedio de 0.750 kg y su CV es de ± 25 %, esto se interpreta así: El 68 % de los valores de GDP están entre 0.563 y 0.938 (mucha variación). Para el grupo “B” también hay mucha variación, la GDP tiene un promedio de 0.650 kg y su CV es de ± 25 %, esto se interpreta así: El 68 % de los valores de GDP están entre 0.490 y 0.813. Con toda seguridad esta variación tan grande es la que impide encontrar diferencias estadísticas significativas entre los promedios.

Otra causa de no obtener diferencias estadísticas significativas, a pesar que las diferencias entre los promedios sean altas es contar con muy pocas unidades experimentales; por ejemplo: 1) Pocos cerdos cuando se trata de evaluar pesos y GDP y 2) Pocos comederos colectivos cuando se trata de evaluar consumo de alimento; y por tanto, Conversión Alimenticia.

Tanto la gran variación en los parámetros, como pocas unidades experimentales (cerdos, corrales), son consecuencia de un mal diseño experimental; pero, digamos que “es muy cómodo” para el nuevo aditivo que se está evaluando esperar a que no haya diferencias con el control y validar así, su efectividad similar.

Elementos para ganar confianza en los resultados.

Otros elementos importantes de una prueba incluyen: 1) Población de estudio definida y homogénea, 2) Asignación aleatoria de sujetos, 3) Enmascaramiento o el cegamiento del observador, 4) Seguimiento exhaustivo y 5) Análisis apropiado (Dewey 1999).

CONFIANZA ESTADÍSTICA.

Aun sólo como lectores de trabajos experimentales, debemos entender qué factores proporcionan confianza en el diseño del experimento.

Unidad Experimental. “El análisis estadístico debe realizarse en el nivel más pequeño al que se puede aplicar el tratamiento”; es decir, estamos hablando del concepto de “Unidad Experimental” (u.e.); seré concreto:

Para la variable de respuesta “peso inicial” y “peso final” de cada animal, es fácil entender que la unidad experimental es cada cerdo; entonces si en un tratamiento hay 10 corrales, cada uno con 20 cerdos, habrá 200 cerdos o 200 u. e. para la variable peso. Por tanto, habrá 200 datos de Ganancia Diaria de Peso (la GDP de cada cerdo = Peso final – Peso inicial ÷ días de la prueba); 200 es un buen número de datos para hacer análisis estadístico.

Para la variable consumo de alimento, el comedero es la unidad experimental. Pero, si hay un comedero para los 20 cerdos por corral (lo habitual), sólo habrá una u.e. por corral; es decir sólo 10 u.e. por tratamiento, dicho de otra forma, sólo 10 datos de consumo de alimento, esto ya puede ser comprometedor para el análisis estadístico (según la variación de los datos de consumo).

Un error muy común es creer que, por contar con muchos cerdos por tratamiento, la confianza del experimento será muy alta, pero todo depende; por ejemplo, si la prueba contó con 400 lechones por tratamiento que se pesan individualmente se tendrán 400 datos de pesos (u.e), pero si la alimentación es automática y sólo se tiene el dato de alimento de la tolva del edificio, sólo hay una unidad experimental para la variable consumo de alimento para los 400 cerdos, con esto no se puede hacer análisis estadístico para el consumo de alimento y en consecuencia, tampoco para la Conversión Alimenticia porque se necesita de los consumos de alimento.

Entonces, como lector de trabajos experimentales, busque usted en los datos ¿con cuántos comederos colectivos se trabajó en cada tratamiento? ¡sólo 4! No son confiables las conclusiones porque, el análisis estadístico no es confiable con tan pocos datos (4).

Ahora bien, si los comederos son individuales, la cosa cambia, la unidad experimental es el comedero, si se tienen 40 cerdos por tratamiento, serán 40 comederos y por tanto 40 datos de consumo de alimento (muy buen número); pero, en pruebas donde la variable consumo de alimento sea importante, no es conveniente hacerlas con cerdos alojados individualmente porque el aislamiento los deprime anímicamente y disminuyen su consumo. La solución es alojar 4 a 6 cerdos por corral-comedero; así, aumentan las unidades experimentales para medir el consumo y, aumentan las oportunidades de que el análisis estadístico funcione.

En conclusión, para la variable de respuesta consumo de alimento, la unidad experimental más pequeña es el comedero colectivo, no los cerdos.

Total de animales por tratamiento.

Depende mucho de la variación de lo que se mida.

El número de animales, corrales o edificios necesarios para evaluar, por ejemplo, si un aditivo es benéfico o no, puede calcularse utilizando fórmulas que se pueden encontrar en los libros de texto de estadística, pero el número de unidades siempre dependerá de: 1) La variación esperada y 2) De la magnitud de la diferencia que se considere importante.

A continuación (en cursivas), información ilustrativa y útil del capítulo: “Farmacología, Terapia y Profilaxis de Medicamentos en Cerdos. Diseases of Swine (10th edition), Locke A. Karriker, Johann Coetzee, Robert M. Friendship, and John F. Prescott (pp 114).

“Por ejemplo, si se supone un coeficiente de variación del 7% para Ganancia Diaria de Peso (GDP), se necesitarían aproximadamente 43 corrales por tratamiento” (demasiados); “pero si sólo se requiere detectar una diferencia en la GDP del 10%, bastarán 12 corrales por tratamiento” (muy manejable).

Análisis estadístico.

Casi siempre el intervalo de confianza es del 95%, esto implica que, la probabilidad de que los resultados sean reales, y no solo por casualidad, es del 95%. El valor P es el nivel de significación, es el opuesto; es decir, P = 0.05 significa que hay un 5% de posibilidad de que los resultados se deban sólo al azar, variación normal.

Sesgo.

En una prueba, todos los tratamientos deben tener las mismas condiciones, excepto lo que se está probando. Hay sesgo cuando algunos animales, o todo el tratamiento reciben condiciones diferentes; y por tanto, ya no hay certeza de que los resultados se deban solamente a lo que se está probando.

Es importante que el sesgo se minimice siempre que sea posible; ejemplo: los sujetos deben asignarse a un grupo de tratamiento en forma aleatoria, si esto no es posible, se puede usar otra asignación sistemática. Las intervenciones deben ser similares; por ejemplo, si el grupo de tratamiento necesita ser sujetado para recibir una inyección del tratamiento, los controles deben de recibir el mismo manejo, pero sólo con un placebo (sustancia inerte). Idealmente, los cuidadores de animales y los observadores clínicos deben estar “ciegos” a qué animales están en el grupo control y cuáles en el tratamiento.

Posición de lector.

Como lector de trabajos experimentales, antes de revisar los resultados, debemos fiscalizar los puntos clave que dan la confianza a cualquier trabajo. En la parte II de estos artículos decía que debemos ser escépticos porque hay muchas mañas para demostrar sólo lo que conviene, pero la ciencia no es un acto de fe, la confianza debe ser demostrada.

Próximamente: Cómo analizar los resultados.

Artículo publicado en Los Porcicultores y su Entorno

×
BM Editores We would like to show you notifications for the latest news and updates.
Descartar
Permitir Las Notificaciones