mlops از دیدگاه مراقبتهای بهداشتی
ترجمه مریم سادات هاشمی از مقاله MLOps from a Healthcare Perspective
معرفی
مراقبتهای بهداشتی بخش مهمی از زندگی انسان میباشد که فناوری بر روی آن تاثیر زیادی گذاشته است. همواره در بسیاری از نقاط جهان، میلیاردها فعالیت بالینی و آزمایشگاهی انجام میگردد و تعداد زیادی داده تولید میشود. علم داده نیز یک حوزه علمی نوظهور میباشد که به سرعت در حال رشد است. دادههای زیادی در عصر امروز وجود دارد و از علم داده میتوان برای درک بهتر آنها استفاده کرد.
MLOps به مجموعهای از فرآیندها، ابزار و روشها اطلاق میشود که هدف آن بهینهسازی و مدیریت فرآیندهای یادگیری ماشین است. وقتی که ماشینها برای حل مسائل یادگیری و هوش مصنوعی استفاده میشوند، MLOps میتواند به تیمهای توسعهدهنده و علم داده کمک کند تا فرآیندهای یادگیری ماشین را مدیریت کرده و بهبود بخشند. این کار شامل مراحلی مانند آمادهسازی دادهها، آموزش مدلها، ارزیابی و انتخاب بهترین مدل، مستندسازی، نگهداری مدلها و همچنین استقرار و پیشبینی است. با توجه به مزیتهای MLOps و ماهیت ظریف مراقبتهای بهداشتی، ادغام این دو حوزه تحقیقاتی نیاز به کار بیشتری دارد.
در حوزه سلامت، نیازمندیها و پیچیدگیها بیشتر از سایر زمینههای علم داده میباشد. رشد سریع علم داده باعث ایجاد ناپایداری و نامنظمی در استانداردها و عملیات شده است. همچنین، در این حوزه هنوز الگوی یکپارچهای برای مدیریت کامل دادهها از تولید تا استقرار مدل وجود ندارد. در صنعت سلامت، فناوری در زمینههای مختلفی مانند تصویربرداری پزشکی و تشخیص پیشبینیکننده توسعه یافته، اما هماهنگی و همراهی بین تحقیقات جهانی هنوز به صورت کامل برقرار نشده است. بنابراین، برای استفاده موثر از مدلهای یادگیری ماشین در بخشهای بالینی، نیازمند قابلیت استقرار و مدیریت مناسب آنها هستیم.
با توجه به آمار، تنها حدود 10٪ از مدلهای ساخته شده در واقع مورد استفاده قرار میگیرند و بقیه حذف میشوند. حتی در این 10٪، بخش بسیار کوچکی به مسائل مرتبط با سلامت اختصاص دارد و میتواند توسط یک دانشمند داده مدیریت شود. برای این منظور، استفاده از MLOps الزامی است. دانشمند داده باید یک فرآیند کاری را پیادهسازی کند که با تلفیق روشهای معمول در DevOps و استفاده از دادههای زیاد حاصل از منابع سلامت، عملکرد و نتایج مدلها در حوزه سلامت را بهبود بخشد.
مزایای MLOps در سلامت
در گذشته، در پزشکی سنتی، پزشکان برای تشخیص مشکلات، به صورت دستی و با چشم تصاویر را بررسی و معاینه میکردند. صحت تشخیص نیز به میزان دقت و تجربه پزشک بستگی داشت. اما با استفاده از بینایی ماشین و فناوری یادگیری عمیق و علم داده، میتوان از محدودیتهای تشخیص انسانی جلوگیری کرد و تشخیصی دقیقتر و بهتر ارائه داد. در واقع، با استفاده از این تکنولوژیها، میتوان تصاویر پزشکی را به صورت خودکار تجزیه و تحلیل نمود و مشکلات موجود را با دقت بیشتری تشخیص داد.
شغل پزشک شباهتهای زیادی با تجزیه و تحلیل داده دارد. پزشک با استفاده از نشانهها یا علائمی که میتواند تشخیص دهد، بیمار را معاینه میکند تا آنها را بیابد. او این علائم را جمعآوری میکند و تشخیصی که بیشترین احتمال را دارد را به عنوان نتیجه خود اعلام میکند.
وقتی که MLOps در بخش تحقیقات مورد استفاده قرار میگیرد و به آن توجه ویژهای شود، نتایجش بسیار واضح و قابل اعتماد خواهند بود. به کمک این رویکرد، تحلیل و پیشبینی به صورت آسان و کارآمد انجام میشود. این بخش، یکی از محبوبترین حوزهها در حوزه تحلیل و پیشبینی در زمینه سلامتی است.
ما نمیتوانیم به نتایج پزشکان پیشبینی بگوییم، بلکه آن را تشخیص مینامیم. زیرا استفاده از کلمه "پیشبینی" ممکن است خطرناک به نظر برسد. با این حال، پزشکان به طور معمول با استفاده از معاینات فیزیکی، آزمایشات و اسکنها، اطلاعاتی را پیدا میکنند که با آنها میتوانند چیزی را پیشبینی کنند. به همین دلیل گاهی اوقات احتمال دارد که بیمار تجربهای متفاوت از تشخیص پزشک داشته باشد. این مسئله مشابه مدلهای پیشبینی است که به دلایل دیگری ممکن است پیشبینی نادرست ارائه دهند. در مورد پزشک، پیشبینی اشتباه میتواند به علت خطای انسانی در دیدن یا اندازهگیری موارد در زمان معاینه یا آزمایش، یا حتی به دلیل کمبود مهارت و تجربه باشد. یک مدل پیشبینی از دادههای تاریخی استفاده میکند، از آنها یاد میگیرد، الگوها را شناسایی میکند و بر اساس آنها پیشبینی میکند، همانطور که پزشک از بیماران گذشته که عمل جراحی موفقیت آمیزی نداشتهاند، یاد میگیرد و میتواند احتمال موفقیت عمل بعدی را پیشبینی کند.
استفاده بهینه از MLOps در یک سیستم علم داده در حوزه بهداشت، میتواند به سیستم این امکان را بدهد که عملکرد بهتری نسبت به برخی از بهترین پزشکان انسانی داشته باشد. همانند بازیهای هوش مصنوعی که موفق به برتری نسبت به استادان بزرگ بازیهای انسانی شدهاند، در حوزه بهداشت نیز این امکان وجود دارد. سیستم علم داده در بهداشت میتواند هزینهها را کاهش داده و در زمان صرفهجویی کند. علاوه بر اقدامات پیشگیرانه، سیستم علم داده اقدامات اصلاحی نیز برای بهبود سلامت انسان ارائه میدهد.
شغل دانشمند داده در حوزه سلامت
شغل یک دانشمند داده در حوزه سلامت دشوارتر از آن چیزی است که تصور میکنید و چالشها و پیچیدگیهای خاص خود را دارد. داشتن دانش عمیق در تمامی زمینههای علم داده ضروری است و همراه با مهارتها و مسئولیتهای زیادی میباشد. دانشمندان داده در حوزه سلامت نه تنها به مهارتهای برنامهنویسی، آمار و ریاضی نیاز دارند، بلکه باید دانشی در زمینه پزشکی و فهمی از صنعت مراقبتهای بهداشتی داشته باشند. وظیفه اصلی هر دانشمند داده، جمعآوری و گزارش دادههاست، بدون توجه به حوزه خاصی که در آن فعالیت میکند.
به دلیل نیاز به حفظ حریم خصوصی بیمار و پیروی از قوانین مانند HIPAA و PCI اجرای یک پروژه داده با چالشهای زیادی برخورد میکند. دانشمندان داده مسئولیت دارند تا از طریق یک فریمورک MLOps، که با مقررات و استانداردهای حفظ حریم خصوصی سازگار است، مدلهای خود را توسعه داده و پیادهسازی کنند. این فریمورک به آنها کمک میکند تا با رعایت قوانین و مقررات مربوطه، بهبودیافتن و قابل اعتماد بودن را در فرآیند کار خود ایجاد کنند.
از برنامههای پیشبینی و مدلسازی که دانشمندان داده در حوزه مراقبتهای بهداشتی ایجاد میکنند؛ برای تجزیه و تحلیل سوابق پزشکی و سایر دادههای مرتبط با سلامت استفاده میشود. معمولا دانشمندان داده نیاز به انجام تحقیقات و توسعه مدلها دارند، اما در حوزه سلامت، اهمیت بیشتری به تطبیق مدلهایشان با روشهای درمانی که پزشکان استفاده میکنند میدهند. به طور دقیقتر، آنها میخواهند مدلهایشان شباهت بیشتری به تصمیمات و توصیههای پزشکان داشته باشند.
استفاده از MLOps در حوزه بهداشت به دانشمندان دادههای مراقبت بهداشتی کمک میکند تا در فرآیند کار خود سازمانیافتهتر عمل کنند. آنها دادهها را با استفاده از اسناد پزشکی، بیمه درمانی و صورتحساب جمعآوری و تجزیه و تحلیل میکنند و با ساختن مدلهایی که الگوها و روندهای مختلف را شناسایی میکنند، راهکارهایی برای بهبود سیستم ارائه میدهند. سپس این مدلها آماده استفاده و نگهداری میشوند تا بتوانند در طول زمان به سیستم کمک کنند.
فریمورک MLOps برای مراقبتهای بهداشتی
در ادامه جریان کار یادگیری ماشین را برای حوزه سلامت بررسی میکنیم و نشان میدهیم که MLOps به طور کلی و در حوزه مهمی مانند سلامت چقدر قوی است. مراحل ساخت مدل به صورت زیر است:
- نسخهسازی از دادههای سلامت؛ تولید و جمعآوری دادهها در سیستمهای بهداشتی ممکن است پویا و تغییرپذیر باشد، به این معنی که حتی بعد از جمعآوری اولیه و شروع فرآیند توسعه مدل، دادههای جدیدی در محیط کار ایجاد شوند. به علت فعالیت مداوم بیمارستانها، این امر احتمالاً رخ میدهد. در نتیجه، باید این دادههای جدید با برچسبگذاری مشخص شوند و مجموعهداده بر اساس بهترین روشهای ممکن، به طور مداوم بهروزرسانی شود. نسخهسازی از دادههای سلامت، یک ابزار است که با استفاده از آن، تغییرات در طول زمان ردیابی و ثبت میشوند.
- اعتبارسنجی دادههای سلامت؛ ارزیابی صحت و قابلیت اعتماد دادهها در یک پروژه بسیار حائز اهمیت است. در حوزه پزشکی، برای اطمینان حاصل کردن از خوب بودن و ارزشمند بودن دادههایی که استفاده میکنیم، نیاز داریم که دادهها را به دقت بررسی کنیم. به عبارت دیگر، برای مدیریت موثر پروژه، لازم است از صحت و قابل اعتماد بودن دادههای بهداشتی اطمینان حاصل کنیم.
- پیش پردازش کارآمد دادهها؛ پیش پردازش دادهها فرآیندی است که دادههای خام را آماده میکند تا بتوانند بهتر پردازش شوند. قبل از بکار بردن دادهها برای تحلیل و استفادههای دیگر، نیاز است که دادهها تغییراتی را طی کنند. این تغییرات شامل حذف دادههای نامطلوب یا اصلاح آنها میشود تا عملکرد بهتری به دست آید و دادهها معتبرتر باشند.
- آموزش موثر مدل یادگیری ماشین؛ پس از انجام مراحل قبلی، مدل میتواند آموزش داده شود تا از دادهها بیاموزد و الگوها و روندهای موجود در آن را شناسایی کند.
- پیگیری آموزش مدل؛ آموزش مدل به تنهایی کافی نیست و نیاز است که بر فرآیند آموزش مدل نظارت کرد. این یکی از مزایای مهم MLOps است. با نظارت و توجه بیشتر بر جریان کار یادگیری ماشین میتوان به نتایج بهتری دست یافت.
- تجزیه و تحلیل و اعتبارسنجی مدلهای آموزشدیده و تنظیمشده ؛ یکی دیگر از مزایای استفاده از MLOps این است که علاوه بر آموزش و آزمایش مدل، بررسی میکنیم که آیا مدل معتبر است یا خیر. اگر مدلها معتبر نباشند، آنها را تنظیم میکنیم تا به یک مدل نهایی برسیم. هنگامی که یک مدل اعتبارسنجی میشود، خروجیهای آن از نظر قابل قبول بودن ارزیابی میشوند. برای جلوگیری از نتایج نامطلوب و بهبود ارتباط، دادههایی که منطقی به نظر میرسند مورد بررسی قرار میگیرند تا ببینیم آیا قابل قبول هستند یا خیر.
- استقرار مدل معتبر؛ پس از اینکه مطمئن شدیم مدل به خوبی آموزش دیده، تست شده و در صورت نیاز تنظیم دقیق شده، میتوان آن را در عمل مورد استفاده قرار داد. در نتیجه سیستم سلامت، دارای سیستمی میباشد که میتواند نیازهای کاربران را بهتر برآورده کند. دانشمند داده همچنان میتواند از این مدل استفاده کند یا به طور مستقیم توسط پزشکان قابل استفاده باشد.
- مقیاسبندی مدل مستقشده؛ تا اینجا، در یک فرآیند یادگیری ماشین معمولی، همه چیز به پایان میرسید. اما با استفاده از MLOps، ما همچنان به چرخه پیشروی ادامه میدهیم. مقیاسبندی به مدل اجازه میدهد که با نیازهای جدیدی که ممکن است در آینده پیش بیایند و مورد توجه قرار نگرفتهاند، سازگار شود. این مسئله باعث میشود مدل ما در مقابل تغییرات قوی پایدار باشد و قابلیت گسترش و تغییر اندازه را داشته باشد.
- گرفتن دادههای آموزشی جدید و عملکرد مدل: در این مرحله، با همکاری نسخهٔ قبلی، دادههای جدید جمعآوری میشوند و مدل مورد استفاده قادر است از آنها استفاده کند و بهبود یابد. فرض کنید شما از یک مدل استفاده میکنید و دادههای خود را وارد میکنید تا نتایجی دریافت کنید. این دادهها همچنان برای بهبود مدل ذخیره میشوند و حتی پس از استقرار، میتوانند به بهبود عملکرد مدل کمک کنند.
نکات بالا نشان میدهد که MLOps در تمام بخشهای یادگیری ماشین، قوی عمل میکند و قابل استفاده است.
استفاده از MLOps برای مراقبت از زخم پس از درمان
TheMathCompany با استفاده از MLOps، یک رویکرد برای مراقبت از زخم پس از درمان ارائه میدهد. این روش شامل مراحل زیر است که بهبود فرآیند مراقبت پس از درمان را ساده میکند:
- ایجاد یک مدل یادگیری ماشین که زمان بهبود زخم را پیشبینی کند؛ و قوی، پویا و در عین حال قابل تعمیم به سطوح یا انواع مختلف زخم باشد.
- ادغام اطلاعات بیمار و درمان در مدل، زیرا تاثیر قابل توجهی بر متغیر مستقل در انواع مختلف زخم دارد.
- اضافه کردن مدل کامل یادگیری ماشین پس از نظارت، تنظیم و اعتبارسنجی با استفاده از دادههای EHR واقعی. تا زمانی که کارایی مدل تایید نشود، نتایج در سیستم قرار نداده نمیشود. پس از آن، مدل به پیشبینی زمان بهبود زخمها کمک میکند.
- استفاده از مدل برای مدت زمان التیام زخم جهت پیشبینی چگونگی بهبود زخم در طول زمان.
- در نظر گرفتن عوامل مختلفی که بر بهبود زخم تأثیر میگذارند به منظور اندازهگیری پیشرفت بهبود زخم. این امر به ما کمک میکند تا نتیجه را با دقت بیشتری تعیین کنیم.
- اندازهگیری تاثیر درمان با پیگیری پیشرفت و یادداشت کردن متغیرهایی که در طول زمان تغییر میکنند. با توجه به مجموعهای از عوامل مربوط به زخم (یعنی نوع زخم، شدت، محل آناتومیک)، عوامل مربوط به بیمار (به عنوان مثال بیماریهای زمینهای، دارو)، و عوامل مربوط به درمان (به عنوان مثال BMI، نتایج آزمایشگاهی) میتوان یک برنامه درمانی بهینه تعیین کرد. سپس، هنگامی که اثربخشی قابل قبولی از طریق نظارت، تجزیه و تحلیل و تنظیم ایجاد گردد، یک آزمایش پایلوت ارائه خواهد شد.
- برقراری ارتباط میان متغیرهای هزینه و پانسمانها و اقدامات، تا EHR بتواند همزمان نتایج بالینی و مقرون به صرفه بودن را تعیین کند. همچنین این اطلاعات میتوانند در موتور توصیه درمانی مبتنی بر داده که تصمیمگیری پزشک را تقویت میکند، مورد استفاده قرار گیرند.
نتیجهگیری
علوم داده در حوزه بهداشت یک رشته نوظهور است. دانشمند داده در حوزه بهداشت از ابزارها و مهارتهای علم داده برای مدیریت و تجزیه و تحلیل مجموعه دادههای عظیم و متنوع در سراسر سیستمهای مراقبتهای بهداشتی استفاده میکند. عموما دانشمندان داده نیاز به انجام تحقیقات یا توسعه مدلها دارند، اما در زمینه سلامت، تمرکز بیشتر بر شبیهسازی دقیق عملکرد یک پزشک در تشخیص و درمان بیماری میباشد. به نظر می رسد فرآیندهای تجزیه و تحلیل دادهها بسیار شبیه به کار یک پزشک است. پزشک با استفاده از اطلاعاتی که در اختیار دارد، بیمار را بررسی میکند و علائم مشاهده شده را جمعآوری مینماید و سپس بهترین سناریو را به عنوان نتیجه ارائه میدهد. برای شبیهسازی صحیح، باید در صنعت بهداشت بسیار دقیق و امیدوارکننده عمل کرد.
نظرات