منابع داده های بزرگ در پزشکی

by کوین هوانگ، MD، MPH؛ بررسی شده توسط ریچارد N. Fogoros، MD

یک تعریف ساده از داده های بزرگ در پزشکی، "مجموع اطلاعات مربوط به مراقبت های بهداشتی و رفاه بیماران است" (Raghupathi 2014). اما این نوع داده ها دقیقا چیست و از کجا آمده اند؟

در زیر، یک مرور کلی از انواع و منابع داده های بزرگ مربوط به ارائه دهندگان مراقبت های بهداشتی، محققان، پرداخت کنندگان، سیاست گذاران و صنعت است.

این دسته بندی ها متقابلا منحصر به فرد نیست، زیرا داده های مشابه می توانند از منابع متنوعی ایجاد شوند.

همچنین این لیست کامل نیست، زیرا کاربرد عملی تجزیه و تحلیل داده های بزرگ قطعا ادامه خواهد یافت.

سیستم های اطلاعات بالینی

این منابع سنتی از اطلاعات بالینی است که ارائه دهندگان خدمات بهداشتی به دیدار عادت می کنند.

پرونده های سلامت الکترونیکی (EHRs) اطلاعات جمع آوری، ذخیره و نمایش داده می شود مانند جمعیت شناسی، تاریخچه پزشکی قبلی، مشکلات پزشکی فعال، ایمن سازی، آلرژی، دارو، علائم حیاتی، نتایج آزمایشات آزمایشگاهی و رادیولوژی، گزارش های آسیب شناسی، یادداشت پیشرفت های ایجاد شده توسط مراقبت های بهداشتی ارائه دهندگان و اسناد اداری و مالی
پرونده های پزشکی پزشکی (EMRs) با EHR ها یکسان نیستند و معمولا مربوط به داده هایی است که توسط یک پزشک خاص ذخیره می شود.
مبادلات اطلاعات سلامت به عنوان توپی بین سیستم های اطلاعات بالینی متفرقه خدمت می کنند

ثبت احوال بیمار، توسط سازمان های مراقبت های بهداشتی توسط بیماران خود نگهداری می شود، اغلب با EHR ارتباط دارد. سایر رجیسترها واکسیناسیون، سرطان، تروما و دیگر مسائل بهداشت عمومی را در مقیاس وسیع جغرافیایی ردیابی می کنند.

پورتال بیمار به بیماران اجازه می دهد تا به اطلاعات شخصی بهداشتی ذخیره شده در EHR سازمان مراقبت های بهداشتی دسترسی داشته باشند. برخی از پورتال بیمار نیز کاربران را مجبور به درخواست مجدد نسخه مجدد و تبادل پیام های الکترونیکی امن با تیم مراقبت های بهداشتی می کنند.

انبار داده های بالینی جمع آوری اطلاعات بیمار از سیستم های مختلف اطلاعات بالینی، مانند EHRs و سایر منابع ذکر شده در بالا

ادعای داده ها از پرداخت کنندگان

متقاضیان عمومی (به عنوان مثال Medicare) و پرداخت کنندگان خصوصی مخازن بزرگ اطلاعات ادعایی را در مورد مزایای آنها دارند. برخی از بیمه گران در حال حاضر نیز مشوق هایی برای به اشتراک گذاشتن اطلاعات بهداشتی شما هستند.

مطالعات پژوهشی

پایگاه داده های تحقیق حاوی اطلاعات در مورد شرکت کنندگان در تحقیق، درمان های تجربی و نتایج بالینی است. مطالعات وسیع معمولا توسط شرکت های داروسازی یا سازمان های دولتی حمایت می شوند. استفاده از دارو شخصی برای مطابقت با بیماران فردی با درمان های موثر است، بر اساس الگوهای داده های آزمایشگاهی بالینی.

این رویکرد فراتر از استفاده از اصول پزشکی مبتنی بر شواهد است که توسط یک متخصص مراقبت های بهداشتی تعیین می کند که آیا بیمار در مورد شرکت کنندگان در محاکمه ویژگی های گسترده ای دارد (مانند سن، جنس، نژاد، وضعیت بالینی). با تجزیه و تحلیل داده های بزرگ، ممکن است یک درمان مبتنی بر اطلاعات بسیار گرانولی مانند نمایه ژنتیکی سرطان بیمار را انتخاب کنید (نگاه کنید به زیر).

سیستم های حمایت از تصمیم گیری بالینی (CDSS) نیز به سرعت در حال توسعه بوده و اکنون بخش بزرگی از هوش مصنوعی (AI) در پزشکی را نشان می دهد.

آنها از داده های بیمار برای کمک به پزشکان با تصمیم گیری استفاده می کنند و اغلب با EHR همراه می شوند.

پایگاه های داده ژنتیکی

مخزن اطلاعات ژنتیکی انسان همچنان به سرعت در حال تجمع است. از آنجایی که پروژه ژنوم انسان در سال 2003 تکمیل شد، هزینه توالی DNA انسان به میزان یک میلیون کاهش یافته است. پروژه ژنوم شخصی (PGP) که در سال 2005 توسط دانشکده پزشکی هاروارد راه اندازی شد، به دنبال یافتن ژنوم کامل 100،000 داوطلب از سراسر جهان است. PGP خود نمونه ای از پروژه بزرگ داده ها به علت حجم منحصر به فرد و انواع داده ها است.

یک ژنوم شخصی حاوی 100 گیگابایت اطلاعات است. علاوه بر توالی ژنوم، PGP همچنین از داده های EHR، نظرسنجی ها و پروفایل های میکروبیوم جمع آوری می کند.

تعدادی از شرکت ها توالی ژنتیکی مستقیم به مصرف کننده را برای سلامتی، صفات شخصیتی و داروسازی و ژنتیک بر پایه تجاری عرضه می کنند.

این اطلاعات شخصی می تواند به تجزیه و تحلیل داده های بزرگ متوسل شود. برای مثال، 23andMe از تاریخ 22 نوامبر 2013 گزارشات ژنتیکی مرتبط با سلامت را به مشتریان جدید متوقف کرد تا با اداره غذا و داروی ایالات متحده مطابقت داشته باشد. با این حال، در سال 2015، شرکت شروع به ارائه برخی از اجزای بهداشتی آزمایش بزاق ژنتیکی خود را دوباره، این بار با تصویب FDA.

پرونده های عمومی

دولت اطلاعات دقیقی از وقایع مربوط به سلامت، مانند مهاجرت، ازدواج، تولد و مرگ را نگه می دارد. سرشماری ایالات متحده از دهه 1790 هر 10 سال یکبار جمع آوری اطلاعات زیادی کرده است. در سال 2013، وبسایت آمار سرشماری سالانه 370 میلیارد سلول با حدود 11 میلیارد دلار افزوده شد.

جستجوهای وب

اطلاعات جستجوی وب جمع آوری شده توسط گوگل و دیگر ارائه دهندگان جستجو در وب می تواند بینش در مورد زمان واقعی مربوط به سلامت جمعیت را فراهم کند. با این حال، ارزش داده های بزرگ از الگوهای جستجو وب ممکن است با ترکیب آن با منابع سنتی اطلاعات سلامت بهبود یابد.

رسانه های اجتماعی

فیس بوک، توییتر و دیگر سیستم های رسانه های اجتماعی یک داده های غنی از اطلاعات را در اطراف ساعت ها تولید می کنند و دیدگاه خود را در مکان ها، رفتارهای بهداشتی، احساسات و تعاملات اجتماعی کاربران می بینند. استفاده از داده های بزرگ رسانه های اجتماعی به سلامت عمومی به عنوان تشخیص بیماری های دیجیتال یا اپیدمیولوژی دیجیتال اشاره شده است. برای مثال توییتر برای تجزیه و تحلیل اپیدمی آنفولانزا در میان جمعیت عمومی مورد استفاده قرار گرفته است.

پروژه جهانی خوشبختی که در دانشگاه پنسیلوانیا آغاز شد، نمونه ای دیگر از مطالعه رسانه های اجتماعی است تا تجربیات و سلامت افراد را بهتر درک کند. این پروژه روانشناسان، آمارگیران و دانشمندان کامپیوتر را جمع آوری می کند که برای مثال، هنگام نوشتن به روز رسانی وضعیت در فیس بوک و توییتر، زبان مورد استفاده در هنگام برقراری ارتباط آنلاین را تحلیل می کند. دانشمندان در حال مشاهده نحوه ارتباط زبان کاربران با سلامت و شادی هستند. پیشرفت در پردازش زبان طبیعی و یادگیری ماشین کمک می کند تا تلاش خود را انجام دهند. یک انتشار اخیر از دانشگاه پنسیلوانیا با بررسی راه های پیشگیری از بیماری های روانی با تحلیل رسانه های اجتماعی به بررسی آن پرداخت. به نظر می رسد علائم افسردگی و سایر شرایط سلامت روانی را می توان با مطالعه استفاده ما از اینترنت شناسایی کرد. دانشمندان در آینده امیدوارند که این روش ها بتوانند افراد را در معرض خطر بیشتری شناسایی و کمک نمایند.

اینترنت چیزها (IoT)

اطلاعات عظیم مربوط به اطلاعات مربوط به سلامتی نیز در دستگاه های تلفن همراه و خانگی ذخیره می شود.

گوشی های هوشمند : هزاران برنامه mHealth اطلاعات مربوط به فعالیت بدنی، مصرف غذا، الگوهای خواب، احساسات و سایر پارامترها را ضبط می کنند. برنامه های تلفن همراه بومی (مانند GPS، ایمیل، پیام کوتاه) همچنین می توانند سرنخ هایی در مورد وضعیت سلامت فرد ارائه دهند.
مانیتورها و دستگاه های پوشیدنی: گام شمار، شتاب سنج، عینک، ساعت و تراشه های تعبیه شده در زیر پوست نیز اطلاعات مربوط به سلامت را جمع آوری می کنند و همچنین می توانند آنها را در ابر قرار دهند.
دستگاه های Telemedicine به ارائه دهندگان مراقبت های بهداشتی اجازه می دهند که پارامترهای بیمار مانند فشار خون، ضربان قلب، میزان تنفس، اکسیژن، دما، رگولاتورهای ECG و وزن را کنترل کنند.

تراکنشهای مالی

معاملات کارت اعتباری بیماران در مدل های پیش بینی شده توسط سیستم HealthCare Carolinas برای شناسایی بیماران که در معرض خطر ابتلا به بازگشت به بیمارستان هستند شامل می شوند. ارائه دهنده مراقبت بهداشتی مبتنی بر شارلوت با استفاده از داده های بزرگ برای تقسیم بیماران به گروه های مختلف، به عنوان مثال، بر اساس بیماری و موقعیت جغرافیایی.

پیامدهای اخلاقی و حفظ حریم خصوصی

لازم به ذکر است که در برخی موارد ممکن است پیامدهای اخلاقی و حفظ حریم خصوصی در هنگام جمع آوری و دسترسی به اطلاعات در مراقبت های بهداشتی وجود داشته باشد. منابع جدید داده های بزرگ می توانند درک ما از تاثیرات افراد و سلامت جمعیت را بهبود بخشند، با این حال، خطرات مختلف باید با دقت مورد توجه و نظارت قرار گیرد. در حال حاضر نیز به رسمیت شناخته شده است که داده های قبلا نامعلوم شناخته شده است، می توان دوباره شناسایی شده است. به عنوان مثال، پروفسور Latanya Sweeney از آزمایشگاه حفظ حریم خصوصی داده های هاروارد، 1130 داوطلب درگیر پروژه ژنوم شخصی را بررسی کرد. او و تیمش توانستند بر اساس اطلاعاتی که آنها به اشتراک گذاشتند (کد پستی، تاریخ تولد، جنسیت) 42 درصد از شرکت کنندگان را به درستی نامگذاری کنند . این دانش می تواند آگاهی ما از خطرات احتمالی را افزایش دهد و به ما در تصمیم گیری در مورد تصمیم گیری بهتر کمک کند.

> منابع:

> Conway M، O'Connor D. رسانه های اجتماعی، داده های بزرگ و سلامت روان: پیشرفت های جاری و پیامدهای اخلاقی. نظر در حال حاضر در روانشناسی 2016؛ 9: 77-82.

> Fernandes L، O'Connor M، Weaver V. اطلاعات بزرگ، نتایج بزرگتر. مجله انجمن مدیریت اطلاعات سلامت آمریکا 2012؛ 83 (10): 38-43

> Guntuku S، Yaden D، Kern M، Ungar L، Eichstaedt J. تشخیص افسردگی و بیماری های روانی در رسانه های اجتماعی: یک بررسی جامع . نظريه جاري در علوم رفتاري 2017؛ 18: 43-49.

> Lazer D، کندی R، پادشاه G، Vespignani A. مقایسهای از گوگل گوگل: تله در تجزیه و تحلیل داده های بزرگ . علم 2014؛ 343 (6176): 1203-1205.

> Raghupathi W، Raghupathi V. تجزیه و تحلیل داده های بزرگ در مراقبت های بهداشتی: وعده و potenti al. علوم و فناوری اطلاعات سلامت 2014؛ 2: 3.

> Sweeney L، Abu A، Winn J. شناسایی شرکت کنندگان در پروژه ژنوم شخصی با نام . دانشگاه هاروارد. خط مشی آزادی اطلاعات مقاله سفید 1021-1. 2013 آوریل 24.