Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

با تشکر از شما برای بازدید از Nature.com. نسخه مرورگر مورد استفاده شما از CSS محدود است. برای بهترین نتیجه ، توصیه می کنیم از نسخه جدیدتر مرورگر خود (یا خاموش کردن حالت سازگاری در اینترنت اکسپلورر) استفاده کنید. در ضمن ، برای اطمینان از پشتیبانی مداوم ، ما سایت را بدون یک ظاهر طراحی شده یا جاوا اسکریپت نشان می دهیم.
دندان ها دقیق ترین شاخص سن بدن انسان محسوب می شوند و اغلب در ارزیابی سن پزشکی قانونی مورد استفاده قرار می گیرند. ما با هدف تأیید برآوردهای سن دندانپزشکی مبتنی بر داده کاوی با مقایسه دقت تخمین و عملکرد طبقه بندی آستانه 18 ساله با روشهای سنتی و برآورد سن مبتنی بر داده کاوی انجام شد. در مجموع 2657 رادیوگرافی پانوراما از شهروندان کره ای و ژاپنی 15 تا 23 سال جمع آوری شد. آنها به یک مجموعه آموزشی تقسیم شدند که هر کدام حاوی 900 رادیوگرافی کره ای و یک مجموعه آزمایش داخلی حاوی 857 رادیوگرافی ژاپنی بودند. ما دقت طبقه بندی و کارآیی روشهای سنتی را با مجموعه آزمایش مدلهای داده کاوی مقایسه کردیم. صحت روش سنتی در مجموعه تست داخلی کمی بالاتر از مدل داده کاوی است و تفاوت آن اندک است (میانگین خطای مطلق <0.21 سال ، میانگین خطای مربع <0.24 سال). عملکرد طبقه بندی برای برش 18 ساله نیز بین روشهای سنتی و مدلهای داده کاوی مشابه است. بنابراین ، روشهای سنتی را می توان هنگام انجام ارزیابی سن پزشکی قانونی با استفاده از بلوغ مولرهای دوم و سوم در نوجوانان کره ای و بزرگسالان ، با مدل های داده کاوی جایگزین کرد.
تخمین سن دندانپزشکی به طور گسترده در پزشکی پزشکی قانونی و دندانپزشکی کودکان مورد استفاده قرار می گیرد. به طور خاص ، به دلیل همبستگی بالای بین سن زمانی و رشد دندانپزشکی ، ارزیابی سن توسط مراحل رشد دندان معیار مهم برای ارزیابی سن کودکان و نوجوانان 1،2،3 است. با این حال ، برای جوانان ، تخمین سن دندانپزشکی بر اساس بلوغ دندان محدودیت های آن را دارد زیرا رشد دندانپزشکی تقریباً کامل است ، به استثنای مولرهای سوم. هدف حقوقی تعیین سن جوانان و نوجوانان ارائه تخمین های دقیق و شواهد علمی در مورد اینکه آیا آنها به سن اکثریت رسیده اند یا خیر. در عمل پزشکی قانونی نوجوانان و بزرگسالان جوان در کره ، سن با استفاده از روش لی برآورد شد و آستانه قانونی 18 سال بر اساس داده های گزارش شده توسط OH و همکاران 5 پیش بینی شد.
یادگیری ماشین نوعی هوش مصنوعی (AI) است که به طور مکرر مقادیر زیادی از داده ها را یاد می گیرد و طبقه بندی می کند ، مشکلات را به تنهایی حل می کند و برنامه نویسی داده ها را هدایت می کند. یادگیری ماشین می تواند الگوهای پنهان مفید را در حجم زیادی از Data6 کشف کند. در مقابل ، روشهای کلاسیک ، که بسیار پر کار و وقت گیر هستند ، ممکن است هنگام برخورد با حجم زیادی از داده های پیچیده که پردازش دستی 7 دشوار هستند ، محدودیت هایی داشته باشند. بنابراین ، بسیاری از مطالعات اخیراً با استفاده از آخرین فن آوری های رایانه ای برای به حداقل رساندن خطاهای انسانی و پردازش کارآمد داده های چند بعدی 8،9،10،11،12 انجام شده است. به طور خاص ، یادگیری عمیق به طور گسترده در تجزیه و تحلیل تصویر پزشکی مورد استفاده قرار گرفته است ، و روش های مختلفی برای تخمین سن با تجزیه و تحلیل خودکار رادیوگرافی برای بهبود صحت و کارآیی تخمین سن 13،15،16،17،18،19،20 گزارش شده است. بشر به عنوان مثال ، Halabi و همکاران 13 الگوریتم یادگیری ماشین را بر اساس شبکه های عصبی حلقوی (CNN) برای برآورد سن اسکلتی با استفاده از رادیوگرافی دست کودکان ایجاد کردند. این مطالعه مدلی را ارائه می دهد که یادگیری ماشین را برای تصاویر پزشکی اعمال می کند و نشان می دهد که این روش ها می توانند دقت تشخیصی را بهبود بخشند. Li et al14 سن تخمین زده شده از تصاویر اشعه ایکس لگن با استفاده از CNN یادگیری عمیق و مقایسه آنها با نتایج رگرسیون با استفاده از برآورد مرحله بیرون زدگی. آنها دریافتند که مدل CNN یادگیری عمیق عملکرد تخمین سن را با مدل رگرسیون سنتی نشان می دهد. مطالعه Guo و همکاران [15] عملکرد طبقه بندی تحمل سن از فناوری CNN را بر اساس ارتوفوتوس دندانپزشکی ارزیابی کردند و نتایج مدل CNN ثابت کرد که انسان از عملکرد طبقه بندی سنی خود بهتر است.
بیشتر مطالعات در مورد برآورد سن با استفاده از یادگیری ماشین از روشهای یادگیری عمیق 13،14،15،16،17،18،19،20 استفاده می کند. تخمین سن مبتنی بر یادگیری عمیق گزارش شده است که دقیق تر از روش های سنتی است. با این حال ، این رویکرد فرصت کمی برای ارائه مبنای علمی برای برآورد سن ، مانند شاخص های سن مورد استفاده در تخمین ها فراهم می کند. همچنین یک اختلاف حقوقی در مورد اینکه چه کسی بازرسی ها را انجام می دهد وجود دارد. بنابراین ، برآورد سن مبتنی بر یادگیری عمیق توسط مقامات اداری و قضایی دشوار است. داده کاوی (DM) تکنیکی است که می تواند نه تنها اطلاعات مورد انتظار بلکه غیر منتظره را به عنوان روشی برای کشف همبستگی های مفید بین مقدار زیادی از داده ها 6،21،22 کشف کند. یادگیری ماشین اغلب در داده کاوی استفاده می شود ، و هم داده کاوی و هم یادگیری ماشین از الگوریتم های کلیدی برای کشف الگوهای موجود در داده ها استفاده می کنند. برآورد سن با استفاده از رشد دندانپزشکی مبتنی بر ارزیابی امتحان از بلوغ دندانهای هدف است و این ارزیابی به عنوان مرحله ای برای هر دندان هدف بیان می شود. از DM می توان برای تجزیه و تحلیل همبستگی بین مرحله ارزیابی دندان و سن واقعی استفاده کرد و پتانسیل جایگزینی تجزیه و تحلیل آماری سنتی را دارد. بنابراین ، اگر تکنیک های DM را برای برآورد سن اعمال کنیم ، می توانیم یادگیری ماشین را در تخمین سن پزشکی قانونی بدون نگرانی در مورد مسئولیت قانونی انجام دهیم. چندین مطالعه تطبیقی در مورد گزینه های احتمالی روشهای دستی سنتی مورد استفاده در عمل پزشکی قانونی و روشهای مبتنی بر EBM برای تعیین سن دندانپزشکی منتشر شده است. شن و همکاران نشان دادند که مدل DM دقیق تر از فرمول سنتی کامر است. گالیبورگ و همکاران از روشهای مختلف DM برای پیش بینی سن مطابق با معیار Demirdjian 25 استفاده کردند و نتایج نشان داد که روش DM در تخمین سن جمعیت فرانسه از روشهای Demirdjian و Willems بهتر است.
برای برآورد عصر دندانپزشکی نوجوانان و بزرگسالان کره ای ، روش لی 4 به طور گسترده در عمل پزشکی قانونی کره مورد استفاده قرار می گیرد. این روش از تجزیه و تحلیل آماری سنتی (مانند رگرسیون چندگانه) برای بررسی رابطه افراد کره ای و سن زمانی استفاده می کند. در این مطالعه ، روشهای تخمین سن به دست آمده با استفاده از روشهای آماری سنتی به عنوان "روشهای سنتی" تعریف می شوند. روش لی یک روش سنتی است و دقت آن توسط OH و همکاران تأیید شده است. 5 ؛ با این حال ، کاربرد برآورد سن بر اساس مدل DM در عمل پزشکی قانونی کره هنوز جای سوال دارد. هدف ما این بود که از نظر علمی سودمندی بالقوه برآورد سن را بر اساس مدل DM تأیید کنیم. هدف از این مطالعه (1) مقایسه صحت دو مدل DM در تخمین سن دندانپزشکی و (2) برای مقایسه عملکرد طبقه بندی 7 مدل DM در سن 18 سال با آنهایی که با استفاده از روشهای آماری سنتی به دست آمده از بلوغ دوم دوم است. و مولرهای سوم در هر دو فک.
میانگین و انحراف استاندارد سن زمانی بر اساس مرحله و نوع دندان در جدول تکمیلی S1 (مجموعه آموزش) ، جدول تکمیلی S2 (مجموعه آزمایش داخلی) و جدول تکمیلی S3 (مجموعه آزمایش خارجی) به صورت آنلاین نشان داده شده است. مقادیر KAPPA برای قابلیت اطمینان داخل و بین المللی به دست آمده از مجموعه آموزش به ترتیب 0.951 و 0.947 بود. مقادیر P و فاصله اطمینان 95 ٪ برای مقادیر KAPPA در جدول مکمل آنلاین S4 نشان داده شده است. ارزش کاپا به عنوان "تقریباً کامل" تعبیر شد ، مطابق با معیارهای لاندیس و Koch26.
هنگام مقایسه میانگین خطای مطلق (MAE) ، روش سنتی کمی بهتر از مدل DM برای همه جنس ها و در مجموعه آزمایش مرد خارجی ، به استثنای Perceptron چند لایه (MLP) است. تفاوت بین مدل سنتی و مدل DM در مجموعه آزمایش داخلی MAE برای مردان 0.12-0.19 سال و برای زنان 0.17-0.21 سال بود. برای باتری آزمایش خارجی ، اختلافات کوچکتر است (0.001-05 سال برای مردان و 0.05-0.09 سال برای زنان). علاوه بر این ، میانگین خطای مربع ریشه (RMSE) کمی پایین تر از روش سنتی است ، با تفاوت های کوچکتر (0.17-0.24 ، 0.2-0.24 برای مجموعه آزمون داخلی مرد ، و 0.03-0.07 ، 0.04-0.08 برای مجموعه تست های خارجی). ). MLP عملکرد کمی بهتر از Perceptron تک لایه (SLP) نشان می دهد ، به جز در مورد مجموعه آزمایش خارجی زن. برای MAE و RMSE ، مجموعه آزمون خارجی بالاتر از مجموعه تست داخلی برای همه جنس ها و مدل ها است. تمام MAE و RMSE در جدول 1 و شکل 1 نشان داده شده است.
MAE و RMSE از مدل های رگرسیون سنتی و داده کاوی. میانگین خطای مطلق MAE ، میانگین خطای ROT RMSE ، SLP Perceptron Single Layer ، Multilayer Perceptron MLP ، روش CM سنتی.
عملکرد طبقه بندی (با قطع 18 سال) از مدلهای سنتی و DM از نظر حساسیت ، ویژگی ، ارزش پیش بینی مثبت (PPV) ، ارزش پیش بینی منفی (NPV) و منطقه تحت منحنی مشخصه عامل گیرنده (AUROC) نشان داده شد. 27 (جدول 2 ، شکل 2 و شکل تکمیلی 1 بصورت آنلاین). از نظر حساسیت باتری تست داخلی ، روشهای سنتی در بین مردان بهترین عملکرد را انجام داده و در بین زنان بدتر می شود. با این حال ، تفاوت در عملکرد طبقه بندی بین روشهای سنتی و SD برای مردان 9.7 ٪ (MLP) و فقط 2.4 ٪ برای زنان (XGBoost) است. در بین مدلهای DM ، رگرسیون لجستیک (LR) در هر دو جنس حساسیت بهتری نشان داد. با توجه به ویژگی مجموعه تست داخلی ، مشاهده شد که چهار مدل SD در مردان عملکرد خوبی دارند ، در حالی که مدل سنتی در زنان عملکرد بهتری داشت. تفاوت در عملکرد طبقه بندی برای مردان و زنان به ترتیب 13.3 ٪ (MLP) و 13.1 ٪ (MLP) است ، که نشان می دهد تفاوت عملکرد طبقه بندی بین مدلها از حساسیت فراتر می رود. در بین مدلهای DM ، دستگاه بردار پشتیبانی (SVM) ، درخت تصمیم گیری (DT) و مدل های جنگل تصادفی (RF) بهترین عملکرد را در بین مردان انجام می دهند ، در حالی که مدل LR بهترین عملکرد را در بین زنان انجام می دهد. AUROC مدل سنتی و تمام مدل های SD بیشتر از 0.925 (K-Nearest همسایه (KNN) در مردان) بود ، که عملکرد طبقه بندی عالی را در تبعیض نمونه های 18 ساله 28 نشان می دهد. برای مجموعه آزمایش خارجی ، از نظر حساسیت ، ویژگی و AUROC در مقایسه با مجموعه آزمایش داخلی ، عملکرد طبقه بندی کاهش یافته است. علاوه بر این ، تفاوت در حساسیت و ویژگی بین عملکرد طبقه بندی بهترین و بدترین مدل ها از 10 ٪ تا 25 ٪ و از تفاوت در مجموعه تست داخلی بزرگتر بود.
حساسیت و ویژگی مدلهای طبقه بندی داده کاوی در مقایسه با روشهای سنتی با قطع 18 سال. KNN K نزدیکترین همسایه ، دستگاه بردار پشتیبانی SVM ، رگرسیون لجستیک LR ، درخت تصمیم DT ، جنگل تصادفی RF ، XGB XGBOOST ، PERCEPTRON چند لایه MLP ، روش CM سنتی.
اولین قدم در این مطالعه مقایسه دقت برآورد سن دندانپزشکی به دست آمده از هفت مدل DM با آنهایی که با استفاده از رگرسیون سنتی به دست آمده است. MAE و RMSE در مجموعه های آزمایش داخلی برای هر دو جنس مورد بررسی قرار گرفتند ، و تفاوت بین روش سنتی و مدل DM از 44 تا 77 روز برای MAE و از 62 تا 88 روز برای RMSE بود. اگرچه روش سنتی در این مطالعه کمی دقیق تر بود ، اما نتیجه گیری این مسئله دشوار است که آیا چنین تفاوت کمی از اهمیت بالینی یا عملی برخوردار است. این نتایج نشان می دهد که صحت برآورد سن دندانپزشکی با استفاده از مدل DM تقریباً مشابه روش سنتی است. مقایسه مستقیم با نتایج حاصل از مطالعات قبلی دشوار است زیرا هیچ مطالعه ای با استفاده از روشهای آماری سنتی با استفاده از همان تکنیک ضبط دندان ها در همان محدوده سنی ، مانند این مطالعه ، دقت مدل های DM را با روشهای آماری سنتی مقایسه نکرده است. گالیبورگ و همکاران 24 MAE و RMSE را بین دو روش سنتی (Demirjian Method25 و Willems Method29) و 10 مدل DM در یک جمعیت فرانسه در سن 2 تا 24 سال مقایسه کردند. آنها گزارش دادند که تمام مدلهای DM از روشهای سنتی دقیق تر بودند ، با تفاوت های 0.20 و 0.38 سال در MAE و 0.25 و 0.47 سال در RMSE در مقایسه با روشهای Willems و Demirdjian. اختلاف بین مدل SD و روشهای سنتی نشان داده شده در مطالعه Halibourg گزارش های بیشماری را در نظر می گیرد 30،31،32،33 که روش Demirdjian به طور دقیق سن دندانپزشکی را در جمعیت های دیگری غیر از کانادایی های فرانسوی که بر اساس این مطالعه بر اساس آن مستقر نشده است ، تخمین نمی زند. در این مطالعه تای و همکاران 34 از الگوریتم MLP برای پیش بینی سن دندان از 1636 عکس ارتودنسی چینی استفاده کردند و دقت آن را با نتایج روش دمیرجیان و ویلمز مقایسه کردند. آنها گزارش دادند که MLP نسبت به روشهای سنتی دقت بالاتری دارد. تفاوت بین روش Demirdjian و روش سنتی <0.32 سال است و روش Willems 0.28 سال است که مشابه نتایج مطالعه حاضر است. نتایج این مطالعات قبلی 24،34 نیز با نتایج مطالعه حاضر سازگار است و دقت تخمین سن مدل DM و روش سنتی مشابه است. با این حال ، بر اساس نتایج ارائه شده ، ما فقط با احتیاط می توانیم نتیجه بگیریم که استفاده از مدل های DM برای تخمین سن ممکن است به دلیل عدم وجود مطالعات قبلی مقایسه ای و مرجع ، روش های موجود را جایگزین کند. مطالعات پیگیری با استفاده از نمونه های بزرگتر برای تأیید نتایج به دست آمده در این مطالعه مورد نیاز است.
در میان مطالعات آزمایش صحت SD در برآورد سن دندانپزشکی ، برخی از دقت بالاتری نسبت به مطالعه ما نشان دادند. Stepanovsky و همکاران 35 22 مدل SD را به رادیوگرافی پانوراما از 976 ساکنان چک 2.7 تا 20.5 سال اعمال کردند و دقت هر مدل را آزمایش کردند. آنها با استفاده از معیارهای طبقه بندی ارائه شده توسط Moorrees و همکاران 36 ، توسعه 16 دندان دائمی بالا و پایین سمت چپ را ارزیابی کردند. MAE از 0.64 تا 0.94 سال و RMSE از 0.85 تا 1.27 سال است که دقیق تر از دو مدل DM مورد استفاده در این مطالعه است. شن و همکاران از روش cameriere برای تخمین سن دندانپزشکی هفت دندان دائمی در فک پایین در ساکنان چین شرقی 5 تا 13 سال استفاده کردند و آن را با سنین تخمین زده شده با استفاده از رگرسیون خطی ، SVM و RF مقایسه کردند. آنها نشان دادند که هر سه مدل DM نسبت به فرمول سنتی Cameriere دقت بالاتری دارند. MAE و RMSE در مطالعه شن در این مطالعه پایین تر از مدل های DM بودند. افزایش دقت مطالعات توسط Stepanovsky و همکاران. 35 و شن و همکاران. 23 ممکن است به دلیل گنجاندن افراد جوان در نمونه های مطالعه آنها باشد. از آنجا که برآورد سن برای شرکت کنندگان در حال توسعه دندان با افزایش تعداد دندان ها در هنگام رشد دندانپزشکی دقیق تر می شود ، دقت روش تخمین سن حاصل ممکن است در هنگام جوان تر شدن شرکت کنندگان در مطالعه به خطر بیفتد. علاوه بر این ، خطای MLP در تخمین سن کمی کوچکتر از SLP است ، به این معنی که MLP دقیق تر از SLP است. MLP برای تخمین سن کمی بهتر در نظر گرفته می شود ، احتمالاً به دلیل لایه های پنهان در MLP38. با این حال ، برای نمونه بیرونی زنان یک استثنا وجود دارد (SLP 1.45 ، MLP 1.49). این یافته که MLP دقیق تر از SLP در ارزیابی سن است ، نیاز به مطالعات گذشته نگر اضافی دارد.
عملکرد طبقه بندی مدل DM و روش سنتی در آستانه 18 ساله نیز مقایسه شد. تمام مدلهای SD آزمایش شده و روشهای سنتی در مجموعه آزمون داخلی ، سطح قابل قبول تبعیض را برای نمونه 18 ساله نشان داد. حساسیت برای زنان و مردان به ترتیب از 87.7 ٪ و 94.9 ٪ بیشتر بود و ویژگی بیشتر از 89.3 ٪ و 84.7 ٪ بود. AUROC از تمام مدلهای آزمایش شده نیز از 0.925 فراتر می رود. به بهترین دانش ما ، هیچ مطالعه ای عملکرد مدل DM را برای طبقه بندی 18 ساله بر اساس بلوغ دندانپزشکی آزمایش نکرده است. ما می توانیم نتایج این مطالعه را با عملکرد طبقه بندی مدل های یادگیری عمیق در رادیوگرافی پانوراما مقایسه کنیم. Guo et al.15 عملکرد طبقه بندی یک مدل یادگیری عمیق مبتنی بر CNN و یک روش دستی را بر اساس روش دمیرجیان برای آستانه سنی خاص محاسبه کرد. حساسیت و ویژگی روش دستی به ترتیب 87.7 ٪ و 5/95 درصد بود و حساسیت و ویژگی مدل CNN به ترتیب از 89.2 ٪ و 6 /86 ٪ فراتر رفت. آنها نتیجه گرفتند که مدل های یادگیری عمیق می توانند در طبقه بندی آستانه های سن ، ارزیابی دستی را جایگزین یا بهتر کنند. نتایج این مطالعه عملکرد طبقه بندی مشابه را نشان داد. اعتقاد بر این است که طبقه بندی با استفاده از مدلهای DM می تواند جایگزین روشهای آماری سنتی برای تخمین سن شود. در بین مدل ها ، DM LR از نظر حساسیت به نمونه مرد و حساسیت و ویژگی برای نمونه زن بهترین مدل بود. LR برای مردان در رتبه دوم قرار دارد. علاوه بر این ، LR یکی از مدلهای DM35 کاربر پسند تر محسوب می شود و پردازش کمتری پیچیده و دشوار است. بر اساس این نتایج ، LR بهترین مدل طبقه بندی برش برای افراد 18 ساله در جمعیت کره در نظر گرفته شد.
به طور کلی ، صحت تخمین سن یا عملکرد طبقه بندی در مجموعه آزمایش خارجی در مقایسه با نتایج موجود در مجموعه آزمون داخلی ضعیف یا پایین تر بود. برخی از گزارش ها حاکی از آن است که دقت طبقه بندی یا کارآیی کاهش می یابد که برآورد سن بر اساس جمعیت کره برای جمعیت ژاپن 5،39 اعمال شود و الگوی مشابهی در مطالعه حاضر یافت شد. این روند وخیم نیز در مدل DM مشاهده شد. بنابراین ، برای برآورد دقیق سن ، حتی هنگام استفاده از DM در فرآیند تجزیه و تحلیل ، روشهای حاصل از داده های جمعیت بومی ، مانند روشهای سنتی ، باید 5،39،40،41،42 ترجیح داده شوند. از آنجا که مشخص نیست که آیا مدلهای یادگیری عمیق می توانند روندهای مشابهی را نشان دهند ، مطالعات مقایسه دقت طبقه بندی و کارآیی با استفاده از روشهای سنتی ، مدل های DM و مدل های یادگیری عمیق در همان نمونه ها مورد نیاز است تا تأیید کند که آیا هوش مصنوعی می تواند بر این نابرابری های نژادی در سن محدود غلبه کند. ارزیابی
ما نشان می دهیم که روشهای سنتی را می توان با برآورد سن بر اساس مدل DM در عمل تخمین سن پزشکی قانونی در کره جایگزین کرد. ما همچنین امکان اجرای یادگیری ماشین را برای ارزیابی سن پزشکی قانونی کشف کردیم. با این حال ، محدودیت های روشنی وجود دارد ، مانند تعداد کافی از شرکت کنندگان در این مطالعه برای تعیین قطعی نتایج و عدم وجود مطالعات قبلی برای مقایسه و تأیید نتایج این مطالعه. در آینده ، مطالعات DM باید با تعداد بیشتری از نمونه ها و جمعیت های متنوع تر انجام شود تا کاربرد عملی آن را در مقایسه با روش های سنتی بهبود بخشد. برای اعتبار سنجی امکان استفاده از هوش مصنوعی برای برآورد سن در جمعیت های متعدد ، مطالعات آینده برای مقایسه دقت طبقه بندی و کارآیی مدلهای DM و یادگیری عمیق با روشهای سنتی در همان نمونه ها مورد نیاز است.
در این مطالعه از 2657 عکس ارتوگرافی جمع آوری شده از بزرگسالان کره ای و ژاپنی 15 تا 23 سال استفاده شده است. رادیوگرافی کره ای به 900 مجموعه آموزشی (65/2 19 19 19.42 سال) و 900 مجموعه آزمایش داخلی (2.59 ± 52 سال 19.52 سال) تقسیم شد. مجموعه آموزش در یک موسسه (بیمارستان سئول سنت مری) جمع آوری شد و مجموعه آزمایش خود در دو موسسه (بیمارستان دندانپزشکی دانشگاه ملی سئول و بیمارستان دندانپزشکی دانشگاه یونسی) جمع آوری شد. ما همچنین 857 رادیوگرافی را از داده های دیگر مبتنی بر جمعیت (دانشگاه پزشکی IWate ، ژاپن) برای آزمایش خارجی جمع آوری کردیم. رادیوگرافی افراد ژاپنی (2.60 ± 31 191 19.31 سال) به عنوان مجموعه آزمایش خارجی انتخاب شدند. داده ها به صورت گذشته نگر برای تجزیه و تحلیل مراحل رشد دندانپزشکی در رادیوگرافی پانوراما گرفته شده در طول درمان دندانپزشکی جمع آوری شد. تمام داده های جمع آوری شده به جز جنس ، تاریخ تولد و تاریخ رادیوگرافی ناشناس بودند. معیارهای ورود و محرومیت همان مطالعات قبلی منتشر شده 4 ، 5 بود. سن واقعی نمونه با کم کردن تاریخ تولد از تاریخ گرفته شده رادیوگرافی محاسبه شد. گروه نمونه به نه گروه سنی تقسیم شد. توزیع سن و جنس در جدول 3 نشان داده شده است. این مطالعه مطابق با اعلامیه هلسینکی انجام شده و توسط هیئت بررسی نهادی (IRB) بیمارستان سئول سنت مری از دانشگاه کاتولیک کره (KC22WISI0328) تأیید شده است. با توجه به طراحی گذشته نگر این مطالعه ، رضایت آگاهانه از کلیه بیماران تحت معاینه رادیوگرافی برای اهداف درمانی حاصل نمی شود. بیمارستان سئول کره سنت مری (IRB) از الزام رضایت آگاهانه چشم پوشی کرد.
مراحل رشد مولرهای دوم و سوم دوتایی با توجه به معیارهای دمکان 25 مورد بررسی قرار گرفت. اگر همان نوع دندان در سمت چپ و راست هر فک پیدا شود ، فقط یک دندان انتخاب می شد. اگر دندانهای همولوگ در هر دو طرف در مراحل مختلف رشد قرار داشته باشند ، دندان با مرحله رشد پایین تر برای عدم اطمینان در سن تخمین زده می شود. یک صد رادیوگرافی انتخاب شده به طور تصادفی از مجموعه آموزش توسط دو ناظر باتجربه برای آزمایش قابلیت اطمینان interobserver پس از پیش بینی برای تعیین مرحله بلوغ دندان به ثمر رسید. قابلیت اطمینان داخل رحمی دو بار در فواصل سه ماهه توسط ناظر اصلی مورد بررسی قرار گرفت.
مرحله جنسی و رشد مولرهای دوم و سوم هر فک در مجموعه آموزش توسط یک ناظر اصلی که با مدلهای مختلف DM آموزش دیده است ، برآورد شد و سن واقعی به عنوان مقدار هدف تعیین شد. مدل های SLP و MLP ، که به طور گسترده در یادگیری ماشین استفاده می شوند ، در برابر الگوریتم های رگرسیون مورد آزمایش قرار گرفتند. مدل DM توابع خطی را با استفاده از مراحل رشد چهار دندان ترکیب می کند و این داده ها را برای تخمین سن ترکیب می کند. SLP ساده ترین شبکه عصبی است و حاوی لایه های پنهان نیست. SLP بر اساس انتقال آستانه بین گره ها کار می کند. مدل SLP در رگرسیون از نظر ریاضی شبیه به رگرسیون خطی چندگانه است. بر خلاف مدل SLP ، مدل MLP دارای چندین لایه پنهان با توابع فعال سازی غیرخطی است. آزمایشات ما از یک لایه پنهان با تنها 20 گره پنهان با عملکردهای فعال سازی غیرخطی استفاده کرد. از نزول شیب به عنوان روش بهینه سازی و MAE و RMSE به عنوان عملکرد از دست دادن برای آموزش مدل یادگیری ماشین ما استفاده کنید. بهترین مدل رگرسیون به دست آمده در مجموعه های آزمایش داخلی و خارجی اعمال شد و سن دندان ها برآورد شد.
یک الگوریتم طبقه بندی تهیه شده است که از بلوغ چهار دندان در مجموعه آموزش استفاده می کند تا پیش بینی کند که نمونه 18 سال سن دارد یا خیر. برای ساخت مدل ، ما هفت الگوریتم یادگیری ماشین بازنمایی 6،43 را به دست آوردیم: (1) LR ، (2) KNN ، (3) SVM ، (4) DT ، (5) RF ، (6) XGBoost و (7) MLP بشر LR یکی از پرکاربردترین الگوریتم های طبقه بندی 44 است. این یک الگوریتم یادگیری تحت نظارت است که از رگرسیون برای پیش بینی احتمال داده های متعلق به یک دسته خاص از 0 تا 1 استفاده می کند و داده ها را به عنوان متعلق به یک دسته محتمل تر بر اساس این احتمال طبقه بندی می کند. عمدتا برای طبقه بندی باینری استفاده می شود. KNN یکی از ساده ترین الگوریتم های یادگیری ماشین 45 است. هنگامی که داده های ورودی جدید داده می شود ، داده های K را نزدیک به مجموعه موجود می یابد و سپس آنها را با بالاترین فرکانس در کلاس طبقه بندی می کند. ما 3 را برای تعداد همسایگان در نظر گرفته (k) تعیین کردیم. SVM یک الگوریتم است که با استفاده از یک تابع هسته ، فاصله بین دو کلاس را به حداکثر می رساند تا فضای خطی را به یک فضای غیرخطی به نام Fields46 گسترش دهد. برای این مدل ، ما از تعصب = 1 ، قدرت = 1 و گاما = 1 به عنوان هایپرپارامترها برای هسته چند جمله ای استفاده می کنیم. DT در زمینه های مختلف به عنوان الگوریتم تقسیم کل داده ها به چندین زیر گروه با ارائه قوانین تصمیم گیری در یک ساختار درخت 47 استفاده شده است. این مدل با حداقل تعداد سوابق در هر گره 2 پیکربندی شده و از شاخص جینی به عنوان اندازه گیری کیفیت استفاده می کند. RF یک روش گروهی است که چندین DTS را برای بهبود عملکرد با استفاده از یک روش جمع آوری bootstrap ترکیب می کند که با ترسیم نمونه هایی با همان اندازه چندین بار از مجموعه داده های اصلی ، طبقه بندی ضعیفی را برای هر نمونه ایجاد می کند. ما از 100 درخت ، 10 عمق درخت ، 1 حداقل اندازه گره و شاخص ترکیب جینی به عنوان معیارهای جداسازی گره استفاده کردیم. طبقه بندی داده های جدید با اکثریت آرا تعیین می شود. XGBOOST یک الگوریتم است که تکنیک های تقویت کننده را با استفاده از روشی که به عنوان آموزش داده ها خطای بین مقادیر واقعی و پیش بینی شده مدل قبلی را در نظر می گیرد ، ترکیب می کند و خطای را با استفاده از شیب 49 افزایش می دهد. این یک الگوریتم به طور گسترده ای به دلیل عملکرد خوب و راندمان منابع و همچنین قابلیت اطمینان بالا به عنوان یک عملکرد تصحیح بیش از حد است. این مدل مجهز به 400 چرخ پشتیبانی است. MLP یک شبکه عصبی است که در آن یک یا چند درک چند لایه با یک یا چند لایه پنهان بین لایه های ورودی و خروجی 38 تشکیل می دهند. با استفاده از این ، می توانید طبقه بندی غیر خطی را انجام دهید که در هنگام اضافه کردن یک لایه ورودی و دریافت مقدار نتیجه ، مقدار نتیجه پیش بینی شده با مقدار نتیجه واقعی مقایسه می شود و خطا به عقب پخش می شود. ما یک لایه پنهان با 20 نورون پنهان در هر لایه ایجاد کردیم. هر مدلی که توسعه دادیم برای آزمایش عملکرد طبقه بندی با محاسبه حساسیت ، ویژگی ، PPV ، NPV و AUROC در مجموعه های داخلی و خارجی اعمال شد. حساسیت به عنوان نسبت نمونه ای که تخمین زده می شود 18 سال یا بالاتر از نمونه ای که تخمین زده می شود 18 سال یا بالاتر تعریف شده است. ویژگی نسبت نمونه های زیر 18 سال و مواردی است که زیر 18 سال تخمین زده می شود.
مراحل دندانپزشکی ارزیابی شده در مجموعه آموزش برای تجزیه و تحلیل آماری به مراحل عددی تبدیل شد. رگرسیون خطی و لجستیک چند متغیره برای توسعه مدل های پیش بینی کننده برای هر جنس انجام شد و فرمول های رگرسیون را استخراج کرد که می تواند برای برآورد سن استفاده شود. ما از این فرمول ها برای تخمین سن دندان برای هر دو مجموعه آزمایش داخلی و خارجی استفاده کردیم. جدول 4 مدل های رگرسیون و طبقه بندی مورد استفاده در این مطالعه را نشان می دهد.
قابلیت اطمینان داخل و interobserver با استفاده از آمار Kappa کوهن محاسبه شد. برای آزمایش صحت مدل های DM و رگرسیون سنتی ، ما MAE و RMSE را با استفاده از سنین تخمین زده شده و واقعی مجموعه های آزمایش داخلی و خارجی محاسبه کردیم. این خطاها معمولاً برای ارزیابی صحت پیش بینی های مدل استفاده می شود. هرچه خطا کوچکتر باشد ، دقت پیش بینی 24 بیشتر است. MAE و RMSE مجموعه های آزمایش داخلی و خارجی را با استفاده از DM و رگرسیون سنتی مقایسه کنید. عملکرد طبقه بندی برش 18 ساله در آمار سنتی با استفاده از یک جدول احتمالی 2 × 2 مورد بررسی قرار گرفت. حساسیت محاسبه شده ، ویژگی ، PPV ، NPV و AUROC مجموعه آزمایش با مقادیر اندازه گیری شده مدل طبقه بندی DM مقایسه شد. داده ها به عنوان میانگین انحراف استاندارد یا تعداد (٪) بسته به ویژگی های داده بیان می شوند. مقادیر P دو طرفه <0.05 از نظر آماری معنی دار در نظر گرفته شد. تمام تجزیه و تحلیل آماری روتین با استفاده از نسخه SAS 9.4 (موسسه SAS ، Cary ، NC) انجام شد. مدل رگرسیون DM در پایتون با استفاده از KERAS50 2.2.4 Backend و TensorFlow51 1.8.0 به طور خاص برای عملیات ریاضی اجرا شد. مدل طبقه بندی DM در محیط تجزیه و تحلیل دانش Waikato و معدنکار اطلاعات Konstanz (KNIME) 4.6.152 پلت فرم تجزیه و تحلیل اجرا شد.
نویسندگان تأیید می کنند که داده های پشتیبانی از نتیجه گیری مطالعه را می توان در مقاله و مواد تکمیلی یافت. مجموعه داده های تولید شده و/یا تجزیه و تحلیل در طول مطالعه از نویسنده مربوطه در صورت درخواست معقول در دسترس است.
Ritz-Timme ، S. et al. ارزیابی سن: وضعیت هنر برای برآورده کردن الزامات خاص عمل پزشکی قانونی. بین المللی بودن J. پزشکی حقوقی. 113 ، 129-136 (2000).
Schmeling ، A. ، Reisinger ، W. ، Geserik ، G. ، and Olze ، A. وضعیت فعلی ارزیابی سن پزشکی قانونی افراد زندگی برای اهداف دادرسی کیفری. پزشکی قانونی دارو. آسیب شناسی 1 ، 239-246 (2005).
پان ، جی. و همکاران. یک روش اصلاح شده برای ارزیابی سن دندانپزشکی کودکان 5 تا 16 ساله در شرق چین. بالینی بررسی شفاهی. 25 ، 3463-3474 (2021).
Lee ، SS و غیره. Chronology از توسعه مولرهای دوم و سوم در کره ای ها و کاربرد آن برای ارزیابی سن پزشکی قانونی. بین المللی بودن J. پزشکی حقوقی. 124 ، 659-665 (2010).
Oh ، S. ، Kumagai ، A. ، Kim ، SY و Lee ، SS دقت تخمین سن و تخمین آستانه 18 ساله بر اساس بلوغ مولرهای دوم و سوم در کره ای ها و ژاپنی ها. PLOS ONE 17 ، E0271247 (2022).
کیم ، جی و همکاران. تجزیه و تحلیل داده های مبتنی بر یادگیری ماشین قبل از عمل می تواند نتیجه درمان جراحی خواب را در بیماران مبتلا به OSA پیش بینی کند. علم گزارش 11 ، 14911 (2021).
هان ، م. و همکاران. تخمین دقیق سن از یادگیری ماشین با یا بدون مداخله انسانی؟ بین المللی بودن J. پزشکی حقوقی. 136 ، 821-831 (2022).
خان ، س. و شاهین ، م. از داده کاوی گرفته تا داده کاوی. j.information. علم https://doi.org/10.1177/01655515211030872 (2021).
Khan ، S. and Shaheen ، M. Wisrule: اولین الگوریتم شناختی برای معدن قانون انجمن. j.information. علم https://doi.org/10.1177/01655515221108695 (2022).
شاهین م. و عبدالله یو. کارم: داده های سنتی کاوی مبتنی بر قوانین انجمن مبتنی بر متن. محاسبه مت ادامه 68 ، 3305-3322 (2021).
محمد م. ، رحمان ز. ، شاهین م. ، خان م. و حبیب م. تشخیص شباهت معنایی مبتنی بر یادگیری عمیق با استفاده از داده های متن. اطلاع رسانی فن آوری ها کنترل. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish ، M. ، Tanoli ، Z. ، and Shahin ، M. سیستمی برای شناخت فعالیت در فیلم های ورزشی. چندرسانه ای برنامه های کاربردی ابزارها https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi ، SS et al. چالش یادگیری ماشین RSNA در سن استخوان کودکان. رادیولوژی 290 ، 498-503 (2019).
لی ، ی. و همکاران. برآورد سن پزشکی قانونی از پرتوهای لگن با استفاده از یادگیری عمیق. یورو تابش 29 ، 2322–2329 (2019).
Guo ، YC ، et al. طبقه بندی دقیق سن با استفاده از روشهای دستی و شبکه های عصبی عمیق از تصاویر طرح ریزی ارتوگرافی. بین المللی بودن J. پزشکی حقوقی. 135 ، 1589-1597 (2021).
آلاباما دالورا و همکاران. برآورد سن استخوان با استفاده از روشهای مختلف یادگیری ماشین: بررسی ادبیات سیستماتیک و متاآنالیز. PLOS ONE 14 ، E0220242 (2019).
Du ، H. ، Li ، G. ، Cheng ، K. ، and Yang ، J. تخمین سن خاص جمعیت آمریکایی های آفریقایی و چینی ها بر اساس حجم محفظه پالپ مولرهای اول با استفاده از توموگرافی کامپیوتری مخروطی. بین المللی بودن J. پزشکی حقوقی. 136 ، 811-819 (2022).
کیم اس. ، لی YH ، نوه YK ، پارک FK و OH KS در حال تعیین گروه های سنی افراد زنده با استفاده از تصاویر مبتنی بر هوش مصنوعی از مولرهای اول. علم گزارش 11 ، 1073 (2021).
استرن ، D. ، Payer ، C. ، Giuliani ، N. ، and Urschler ، M. تخمین خودکار سن و طبقه بندی سنی اکثریت از داده های MRI چند متغیره. IEEE J. Biomed. هشدارهای بهداشتی 23 ، 1392–1403 (2019).
Cheng ، Q. ، Ge ، Z. ، Du ، H. and Li ، G. تخمین سن مبتنی بر تقسیم محفظه خمیر سه بعدی از مولرهای اول از توموگرافی محاسبه شده پرتو مخروطی با ادغام مجموعه های یادگیری عمیق و سطح. بین المللی بودن J. پزشکی حقوقی. 135 ، 365-373 (2021).
Wu ، Wt ، et al. داده کاوی در داده های بزرگ بالینی: بانکهای اطلاعاتی مشترک ، مراحل و روشها. جهان دارو. منبع 8 ، 44 (2021).
یانگ ، جی. و همکاران. آشنایی با بانکهای اطلاعاتی پزشکی و فن آوری های داده کاوی در دوران بزرگ داده. J. Avid. داروی اساسی 13 ، 57-69 (2020).
شن ، س. و همکاران. روش Camerer برای برآورد سن دندان با استفاده از یادگیری ماشین. BMC Health Sealth 21 ، 641 (2021).
گالبورگ A. و همکاران. مقایسه روشهای مختلف یادگیری ماشین برای پیش بینی سن دندانپزشکی با استفاده از روش مرحله بندی Demirdjian. بین المللی بودن J. پزشکی حقوقی. 135 ، 665-675 (2021).
Demirdjian ، A. ، Goldstein ، H. and Tanner ، JM سیستم جدیدی برای ارزیابی سن دندانپزشکی. خروپف زیست شناسی 45 ، 211–227 (1973).
Landis ، Jr و Koch ، GG اقدامات توافق ناظر در مورد داده های طبقه بندی شده. بیومتریک 33 ، 159-174 (1977).
Bhattacharjee S ، Prakash D ، Kim C ، Kim HK و Choi HK. تجزیه و تحلیل بافتی ، مورفولوژیکی و آماری تصویربرداری رزونانس مغناطیسی دو بعدی با استفاده از تکنیک های هوش مصنوعی برای تمایز تومورهای مغزی اولیه. اطلاعات بهداشتی منبع https://doi.org/10.4258/hir.2022.28.1.46 (2022).

زمان پست: ژانویه -04-2024

اعتبارسنجی یک مدل داده کاوی در برابر روشهای تخمین سنتی سن دندانپزشکی در بین نوجوانان کره ای و بزرگسالان