การได้จำนวนที่มากพอในการตรวจสอบวิธีการรักษาอย่างเที่ยงธรรม

Download a pdf of Obtaining large enough numbers in fair tests of treatments

บางครั้งเมื่อตรวจสอบวิธีการรักษา ก็อาจได้จำนวนคนมากพอจากงานวิจัยที่ทำใน 1 หรือ 2 แหล่งวิจัย แต่การประเมินผลการรักษาที่เกิดน้อย เช่น การเสียชีวิตมักจำเป็นต้องเชิญชวนผู้ป่วยจากหลายแหล่ง      บ่อยครั้งก็จากหลายประเทศ ให้เข้าร่วมในงานวิจัยเพื่อให้ได้หลักฐานที่เชื่อถือได้ เช่น การศึกษาในผู้ป่วย 10,000 รายจาก 13 ประเทศ พิสูจน์ว่าการให้สเตียรอยด์กับคนที่สมองบาดเจ็บรุนแรง  ซึ่งเป็นวิธีการรักษาที่ใช้กันมากว่า 30 ปีนั้น เป็นอันตรายถึงชีวิต [2] ในการตรวจสอบอย่างเที่ยงธรรมอีกครั้งหนึ่งซึ่งดำเนินโดยทีมวิจัยทีมเดิม การศึกษาในผู้ป่วย 20,000 รายจาก 40 ประเทศ พิสูจน์ว่ายาที่ราคาย่อมเยาชื่อว่า กรดทราเนซามิก (tranexamic acid) ลดการเสียชีวิตจากเลือดออกหลังบาดเจ็บ [3] เนื่องจากการศึกษาเหล่านี้ถูกออกแบบมาให้ลดทั้งความลำเอียงและความไม่แน่นอนเนื่องจากความบังเอิญ จึงเป็นการตรวจสอบอย่างเที่ยงธรรมที่ควรเอาเป็นเยี่ยงอย่าง และเป็นหลักฐานคุณภาพดีที่มีคุณอนันต์ต่อการดูแลสุขภาพทั่วโลก ในการสำรวจโดย บีเอ็มเจ การทดลองแบบสุ่มเรื่องที่สองนี้ถูกโหวตให้เป็นการศึกษาที่สำคัญที่สุดในปี ค.ศ. 2010

Tranexamic acid forest plot

ผลจากกรดทราาเนซามิกต่อการเสียชีวิตในผู้ป่วยที่บาดเจ็บโดยมีเลือดออกรุนแรง วิเคราะห์รวมและแยกตามทวีปที่ผู้เข้าร่วมการศึกษาอยู่ (ข้อมูลที่ไม่ได้ตีพิมพ์จาก CRASH-2: Lancet 2010;376:23-32)

ภาพด้านล่างสร้างจากข้อมูลซึ่งเอื้อเฟื้อโดยทีมที่ได้รับรางวัล เพื่อเป็นตัวอย่างว่าการใช้ข้อมูลให้มากเท่าที่หาได้มาคาดคะเนผลการรักษามีความสำคัญเพียงใดในการลดความเสี่ยงที่จะถูกความบังเอิญตบตา สี่เหลี่ยมข้าวหลามตัดในแถวล่างสุดของภาพแทนผลโดยรวมของการศึกษาเกี่ยวกับกรดทราเนซามิก และแสดงว่ายาลดการเสียชีวิตจากภาวะเลือดออกได้เกือบร้อยละ 30 (อัตราส่วนความเสี่ยงสูงกว่า 0.7 เล็กน้อย) ผลโดยรวมนี้คือค่าประมาณที่น่าเชื่อถือที่สุดของผลจากยาดังกล่าว แม้ว่าค่าประมาณจากแหล่งวิจัยในทวีป A จะได้ผลที่ไม่โดดเด่นนัก (คือไม่มีนัยสำคัญทางสถิติ และน่าจะต่ำกว่าผลที่แท้จริง) และค่าประมาณจากแหล่งวิจัยในกลุ่ม “ทวีปอื่นๆ” บ่งว่าผลที่ได้โดดเด่นมาก  (ซึ่งเป็นไปได้มากว่าจะเกินจริง)

ในลักษณะคล้ายกับที่เราลดผลจากความบังเอิญได้ด้วยการรวมข้อมูลจากหลายแหล่งวิจัยในการทดลองระดับนานาชาติ เราก็อาจรวมผลจากหลายการศึกษาที่เป็นเอกเทศ แต่คล้ายคลึงกันได้ด้วยสถิติ โดยกระบวนการที่เรียกว่า “การวิเคราะห์เชิงอภิมาน (meta-analysis)” (ดูเพิ่มเติมในบทที่ 8) แม้นักสถิติจะพัฒนาวิธีวิเคราะห์เชิงอภิมานไว้นานแล้ว แต่เพิ่งเริ่มนำมาประยุกต์ใช้แพร่หลายในทศวรรษ 1970 โดยเริ่มในหมู่นักสังคมศาสตร์ในสหรัฐอเมริกา ตามด้วยนักวิจัยด้านการแพทย์ ในช่วงปลายศตวรรษที่ 20 การวิเคราะห์เชิงอภิมานเป็นที่ยอมรับแพร่หลายว่า เป็นองค์ประกอบสำคัญในการตรวจสอบวิธีการรักษาอย่างเที่ยงธรรม

ตัวอย่างเช่น มีการศึกษา 5 โครงการใน 5 ประเทศ ซึ่งได้รับทุนและดำเนินการแยกกัน เพื่อตอบคำถามที่ไร้คำตอบมานาน 60 ปีว่า ในเด็กที่คลอดก่อนกำหนด “ระดับออกซิเจนในเลือดเท่าไรมีแนวโน้มสูงสุดที่จะช่วย ให้ทารกรอดชีวิตโดยไม่มีความพิการร้ายแรง” ถ้าระดับออกซิเจนในเลือดสูงเกินไป ทารกอาจตาบอด ถ้าต่ำเกินไป ทารกอาจเสียชีวิต หรือสมองฝ่อ แม้แต่ในทารกที่บอบบางอย่างนี้ ผลจากระดับออกซิเจนต่างๆ กันก็ยังไม่น่าแตกต่างกันเด่นชัด จึงต้องมีทารกจำนวนมากถึงจะตรวจพบได้ ดังนั้นทีมวิจัย ซึ่งเป็นผู้รับผิดชอบการศึกษาทั้งห้า จึงเห็นพ้องกันว่าจะรวบรวมหลักฐานจากแต่ละการศึกษา เพื่อให้ได้ค่าประมาณที่น่าเชื่อถือมากกว่าที่ได้จากแต่ละการศึกษาแยกกัน [4]

เพิ่มเติมเอกสารอ้างอิง (บทที่ 7)

บทถัดไป: บทที่ 8 ประเมินหลักฐานที่เชื่อถือได้ที่เกี่ยวข้องทั้งหมด