مقدمه: سرطان پستان دومین عامل شایع مرگ و میر در میان زنان جهان محسوب میشود. طبقهبندی زیر شاخههای مختلف این سرطان نقش کلیدی در تشخیص زودهنگام و درمان فردمحور ایفا می کند. هدف این مطالعه بهرهگیری از یک رویکرد مبتنی بر یادگیری ماشین در راستای توسعه مدلهای پیشبینی کنندهی زیر گروههای سرطان پستان با استفاده از مجموعه دادههای تک آمیک می باشد.
مواد و روشها: در این مطالعه مجموعه دادههای بیانی RNAseq با سایز 526 نمونه و دادههای بیانی miRNA با 755 نمونه از پایگاه دادهای اطلس ژنوم سرطانTCGA-BRCA استخراج شدند. مدلها با استفاده از یک چارچوب جامع که استخراج اطلاعات کلیدی از دادههای تک-اُمیک، یکپارچهسازی دادههای ناهمگون از منابع مختلف، کاهش ابعاد و ارزیابی مدل را در خود جای داده بود، آموزش داده شدند. عملکرد مدلها با استفاده از معیارهای مختلف از جمله دقت، صحت، بازیابی، امتیاز F1 و سطح زیر منحنی مشخصه عملکرد گیرنده (AUC-ROC) برای طبقه بندی کنندههای رگرسیون حداقل مربعات جزئی، جنگل تصادفی، بیز ساده، درخت تصمیم، شبکههای عصبی، و رگرسیون لاسو ارزیابی شده است.
یافتهها: نتایج این تحقیق نشان میدهد که طبقهبندیکنندههای جنگل تصادفی و رگرسیون لاسو به ترتیب با دقت پیشبینی 92/81٪ و 95/01٪، بهترین عملکرد را در میان مدلهای بررسی شده داشتند. نمودار مشخصه عملکرد سیستم (ROC) برای این دو روش با سطح زیر نمودار (AUC) معادل 0/97، برتری واضحی نسبت به سایر روشها نشان میدهد. همچنین، ارقام بازیابی بالا (93/61٪ برای جنگل تصادفی و 93/82٪ برای رگرسیون لاسو) نمایانگر موفقیت این تکنیکها در جمعآوری نمونههای مثبت هستند. علاوه بر این، این دو طبقهبندیکننده رتبهبندی F1 بالایی کسب کردهاند که نشاندهنده دقت، بازیابی و کارایی کلی مطلوب آنها میباشد.
نتیجهگیری: این مطالعه پتانسیل مدل پیشنهادی مبتنی بر هوش مصنوعی را در تشخیص زیرگروههای سرطان پستان برجسته میکند. چارچوب پیشنهادی میتواند با بکارگیری داده های بالینی در دسترس برای تشخیص زودهنگام، پیشبینی دقیق و درمان متناسب با بیمار پیادهسازی شده و بار سرطان ناشی از عوارض و مرگ و میر را کاهش دهد.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |