• ما

اعتبار سنجی یک مدل داده کاوی در برابر روش های سنتی تخمین سن دندانپزشکی در میان نوجوانان و بزرگسالان کره ای

از بازدید شما از Nature.com سپاسگزاریم.نسخه مرورگری که استفاده می کنید پشتیبانی محدودی از CSS دارد.برای بهترین نتایج، توصیه می کنیم از نسخه جدیدتر مرورگر خود استفاده کنید (یا حالت سازگاری را در اینترنت اکسپلورر خاموش کنید).در عین حال، برای اطمینان از پشتیبانی مداوم، سایت را بدون استایل یا جاوا اسکریپت نشان می دهیم.
دندان ها دقیق ترین شاخص سن بدن انسان در نظر گرفته می شوند و اغلب در ارزیابی سن پزشکی قانونی استفاده می شوند.ما با مقایسه دقت تخمین و عملکرد طبقه‌بندی آستانه 18 ساله با روش‌های سنتی و تخمین‌های سنی مبتنی بر داده‌کاوی، اعتبار تخمین‌های سن دندانپزشکی مبتنی بر داده‌کاوی را تأیید کردیم.در مجموع 2657 رادیوگرافی پانوراما از شهروندان کره ای و ژاپنی 15 تا 23 ساله جمع آوری شد.آنها به یک مجموعه آموزشی که هر کدام شامل 900 رادیوگرافی کره ای بود و یک مجموعه تست داخلی شامل 857 رادیوگرافی ژاپنی تقسیم شدند.ما دقت طبقه‌بندی و کارایی روش‌های سنتی را با مجموعه‌های آزمایشی مدل‌های داده کاوی مقایسه کردیم.دقت روش سنتی در مجموعه تست داخلی کمی بیشتر از مدل داده کاوی است و تفاوت آن کم است (میانگین خطای مطلق <0.21 سال، ریشه میانگین مربعات خطا <0.24 سال).عملکرد طبقه بندی برای قطع 18 ساله نیز بین روش های سنتی و مدل های داده کاوی مشابه است.بنابراین، روش‌های سنتی را می‌توان با مدل‌های داده‌کاوی در هنگام انجام ارزیابی سن پزشکی قانونی با استفاده از بلوغ دندان‌های مولر دوم و سوم در نوجوانان و بزرگسالان کره‌ای جایگزین کرد.
تخمین سن دندانی به طور گسترده در پزشکی قانونی و دندانپزشکی کودکان استفاده می شود.به طور خاص، به دلیل همبستگی زیاد بین سن تقویمی و رشد دندانی، ارزیابی سن بر اساس مراحل رشد دندانی، معیار مهمی برای ارزیابی سن کودکان و نوجوانان است1،2،3.با این حال، برای جوانان، تخمین سن دندانی بر اساس بلوغ دندانی دارای محدودیت هایی است زیرا به استثنای دندان آسیاب سوم، رشد دندان تقریباً کامل شده است.هدف قانونی از تعیین سن جوانان و نوجوانان، ارائه برآوردهای دقیق و شواهد علمی از رسیدن آنها به سن بلوغ است.در عمل پزشکی-حقوقی نوجوانان و بزرگسالان جوان در کره، سن با استفاده از روش لی تخمین زده شد و آستانه قانونی 18 سال بر اساس داده های گزارش شده توسط Oh و همکاران 5 پیش بینی شد.
یادگیری ماشینی نوعی هوش مصنوعی (AI) است که به طور مکرر مقادیر زیادی از داده ها را یاد می گیرد و طبقه بندی می کند، مشکلات را به تنهایی حل می کند و برنامه نویسی داده را هدایت می کند.یادگیری ماشینی می تواند الگوهای پنهان مفیدی را در حجم زیادی از داده ها کشف کند.در مقابل، روش‌های کلاسیک، که کار فشرده و زمان‌بر هستند، ممکن است هنگام برخورد با حجم زیادی از داده‌های پیچیده که پردازش دستی آنها دشوار است، محدودیت‌هایی داشته باشند.بنابراین، اخیراً مطالعات زیادی با استفاده از آخرین فناوری‌های رایانه‌ای برای به حداقل رساندن خطاهای انسانی و پردازش کارآمد داده‌های چند بعدی انجام شده است8،9،10،11،12.به ویژه، یادگیری عمیق به طور گسترده در تجزیه و تحلیل تصویر پزشکی استفاده شده است، و روش های مختلفی برای تخمین سن با تجزیه و تحلیل خودکار رادیوگرافی گزارش شده است که دقت و کارایی تخمین سن را بهبود می بخشد13،14،15،16،17،18،19،20. .برای مثال، حلبی و همکاران 13 یک الگوریتم یادگیری ماشینی را بر اساس شبکه‌های عصبی کانولوشنال (CNN) برای تخمین سن اسکلتی با استفاده از رادیوگرافی دست‌های کودکان توسعه دادند.این مطالعه مدلی را پیشنهاد می‌کند که یادگیری ماشینی را در تصاویر پزشکی اعمال می‌کند و نشان می‌دهد که این روش‌ها می‌توانند دقت تشخیصی را بهبود بخشند.لی و همکاران 14 سن را از تصاویر اشعه ایکس لگن با استفاده از CNN یادگیری عمیق تخمین زدند و آنها را با نتایج رگرسیون با استفاده از تخمین مرحله استخوان سازی مقایسه کردند.آنها دریافتند که مدل یادگیری عمیق CNN عملکرد تخمین سنی مشابه مدل رگرسیون سنتی را نشان می دهد.مطالعه Guo و همکاران [15] عملکرد طبقه بندی تحمل سنی فناوری CNN را بر اساس ارتوفوتوهای دندانی ارزیابی کردند و نتایج مدل CNN ثابت کرد که انسان ها از عملکرد طبقه بندی سنی خود بهتر عمل کردند.
اکثر مطالعات در مورد تخمین سن با استفاده از یادگیری ماشینی از روش های یادگیری عمیق 13،14،15،16،17،18،19،20 استفاده می کنند.تخمین سن بر اساس یادگیری عمیق دقیق تر از روش های سنتی گزارش شده است.با این حال، این رویکرد فرصت کمی برای ارائه مبنای علمی برای تخمین سن، مانند شاخص های سنی مورد استفاده در تخمین ها، فراهم می کند.همچنین بر سر اینکه چه کسی بازرسی را انجام می دهد، اختلاف حقوقی وجود دارد.بنابراین، برآورد سن بر اساس یادگیری عمیق از سوی مراجع اداری و قضایی دشوار است.داده کاوی (DM) تکنیکی است که می تواند نه تنها اطلاعات مورد انتظار بلکه غیرمنتظره را به عنوان روشی برای کشف همبستگی های مفید بین مقادیر زیادی از داده ها کشف کند6،21،22.یادگیری ماشینی اغلب در داده کاوی استفاده می شود و هم داده کاوی و هم یادگیری ماشین از الگوریتم های کلیدی یکسانی برای کشف الگوها در داده ها استفاده می کنند.تخمین سن با استفاده از رشد دندانی بر اساس ارزیابی معاینه کننده از بلوغ دندان های هدف است و این ارزیابی به عنوان مرحله ای برای هر دندان هدف بیان می شود.DM را می توان برای تجزیه و تحلیل ارتباط بین مرحله ارزیابی دندانپزشکی و سن واقعی استفاده کرد و این پتانسیل را دارد که جایگزین تجزیه و تحلیل آماری سنتی شود.بنابراین، اگر از تکنیک‌های DM برای تخمین سن استفاده کنیم، می‌توانیم بدون نگرانی در مورد مسئولیت قانونی، یادگیری ماشین را در تخمین سن پزشکی قانونی پیاده‌سازی کنیم.چندین مطالعه مقایسه ای در مورد جایگزین های احتمالی برای روش های دستی سنتی مورد استفاده در پزشکی قانونی و روش های مبتنی بر EBM برای تعیین سن دندان منتشر شده است.شن و همکاران 23 نشان دادند که مدل DM دقیق تر از فرمول سنتی Camerer است.گالیبورگ و همکاران 24 روش‌های مختلف DM را برای پیش‌بینی سن با توجه به معیار دمیرجیان به کار بردند و نتایج نشان داد که روش DM در تخمین سن جمعیت فرانسوی از روش‌های دمیرجیان و ویلمز بهتر عمل می‌کند.
برای تخمین سن دندانی نوجوانان و بزرگسالان کره ای، روش 4 لی به طور گسترده در پزشکی قانونی کره استفاده می شود.این روش از تجزیه و تحلیل آماری سنتی (مانند رگرسیون چندگانه) برای بررسی رابطه بین افراد کره ای و سن تقویمی استفاده می کند.در این مطالعه، روش‌های تخمین سن به‌دست‌آمده با روش‌های آماری سنتی به عنوان «روش‌های سنتی» تعریف می‌شوند.روش لی یک روش سنتی است و صحت آن توسط Oh و همکاران تایید شده است.5با این حال، کاربرد تخمین سن بر اساس مدل DM در عمل پزشکی قانونی کره هنوز مشکوک است.هدف ما تایید علمی سودمندی بالقوه تخمین سن بر اساس مدل DM بود.هدف از این مطالعه (1) مقایسه دقت دو مدل DM در تخمین سن دندانی و (2) مقایسه عملکرد طبقه‌بندی 7 مدل DM در سن 18 سالگی با مدل‌های به‌دست‌آمده از روش‌های آماری سنتی بلوغ ثانیه بود. و آسیاب سوم در هر دو فک.
میانگین و انحراف معیار سن تقویمی بر اساس مرحله و نوع دندان به صورت آنلاین در جدول تکمیلی S1 (مجموعه آموزشی)، جدول تکمیلی S2 (مجموعه تست داخلی) و جدول تکمیلی S3 (مجموعه تست خارجی) نشان داده شده است.مقادیر کاپا برای قابلیت اطمینان درون و بین ناظر به دست آمده از مجموعه آموزشی به ترتیب 951/0 و 947/0 بود.مقادیر P و فاصله اطمینان 95% برای مقادیر کاپا در جدول تکمیلی آنلاین S4 نشان داده شده است.مقدار کاپا به عنوان "تقریبا کامل"، مطابق با معیارهای Landis و Koch26 تفسیر شد.
هنگام مقایسه میانگین خطای مطلق (MAE)، روش سنتی کمی بهتر از مدل DM برای همه جنسیت ها و در مجموعه تست مردانه خارجی، به استثنای پرسپترون چند لایه (MLP) عمل می کند.تفاوت بین مدل سنتی و مدل DM در مجموعه تست MAE داخلی 0.12-0.19 سال برای مردان و 0.17-0.21 سال برای زنان بود.برای باتری تست خارجی، تفاوت ها کوچکتر است (0.001-0.05 سال برای مردان و 0.05-0.09 سال برای زنان).علاوه بر این، ریشه میانگین مربعات خطا (RMSE) کمی کمتر از روش سنتی است، با تفاوت های کوچکتر (0.17-0.24، 0.2-0.24 برای مجموعه تست داخلی مرد، و 0.03-0.07، 0.04-0.08 برای مجموعه تست خارجی).).MLP عملکرد کمی بهتر از پرسپترون تک لایه (SLP) نشان می دهد، به جز در مورد مجموعه تست خارجی زن.برای MAE و RMSE، نمرات مجموعه آزمون خارجی بالاتر از مجموعه آزمون داخلی برای همه جنسیت ها و مدل ها است.تمام MAE و RMSE در جدول 1 و شکل 1 نشان داده شده است.
MAE و RMSE مدل های رگرسیون سنتی و داده کاوی.میانگین خطای مطلق MAE، ریشه میانگین مربعات خطا RMSE، پرسپترون SLP تک لایه، MLP پرسپترون چند لایه، روش سنتی CM.
عملکرد طبقه‌بندی (با قطع 18 سال) مدل‌های سنتی و DM از نظر حساسیت، ویژگی، ارزش اخباری مثبت (PPV)، ارزش اخباری منفی (NPV) و سطح زیر منحنی مشخصه عملکرد گیرنده (AUROC) نشان داده شد. 27 (جدول 2، شکل 2 و شکل تکمیلی 1 به صورت آنلاین).از نظر حساسیت باتری تست داخلی، روش‌های سنتی بهترین عملکرد را در بین مردان و بدتر در بین زنان داشتند.با این حال، تفاوت در عملکرد طبقه بندی بین روش های سنتی و SD برای مردان 9.7٪ (MLP) و تنها 2.4٪ برای زنان (XGBoost) است.در بین مدل‌های DM، رگرسیون لجستیک (LR) حساسیت بهتری را در هر دو جنس نشان داد.با توجه به ویژگی مجموعه تست داخلی، مشاهده شد که چهار مدل SD در مردان عملکرد خوبی داشتند، در حالی که مدل سنتی در زنان بهتر عمل کرد.تفاوت در عملکرد طبقه بندی برای مردان و زنان به ترتیب 13.3٪ (MLP) و 13.1٪ (MLP) است، که نشان می دهد تفاوت در عملکرد طبقه بندی بین مدل ها از حساسیت بیشتر است.در بین مدل‌های DM، ماشین بردار پشتیبان (SVM)، درخت تصمیم (DT) و مدل‌های جنگل تصادفی (RF) بهترین عملکرد را در بین مردان داشتند، در حالی که مدل LR بهترین عملکرد را در بین زنان داشت.AUROC مدل سنتی و همه مدل‌های SD بیشتر از 0.925 (k-نزدیک‌ترین همسایه (KNN) در مردان بود که عملکرد طبقه‌بندی عالی را در نمونه‌های 18 ساله متمایز نشان می‌دهد.برای مجموعه تست خارجی، کاهش عملکرد طبقه بندی از نظر حساسیت، ویژگی و AUROC در مقایسه با مجموعه تست داخلی وجود داشت.علاوه بر این، تفاوت در حساسیت و ویژگی بین عملکرد طبقه بندی بهترین و بدترین مدل از 10٪ تا 25٪ متغیر بود و بزرگتر از تفاوت در مجموعه تست داخلی بود.
حساسیت و ویژگی مدل های طبقه بندی داده کاوی در مقایسه با روش های سنتی با برش 18 ساله.KNN k نزدیکترین همسایه، ماشین بردار پشتیبانی SVM، رگرسیون لجستیک LR، درخت تصمیم DT، جنگل تصادفی RF، XGB XGBoost، پرسپترون چند لایه MLP، روش سنتی CM.
اولین گام در این مطالعه مقایسه دقت تخمین های سن دندانی به دست آمده از هفت مدل DM با آنهایی بود که با استفاده از رگرسیون سنتی به دست آمده بودند.MAE و RMSE در مجموعه‌های تست داخلی برای هر دو جنس مورد ارزیابی قرار گرفتند و تفاوت بین روش سنتی و مدل DM از 44 تا 77 روز برای MAE و از 62 تا 88 روز برای RMSE متغیر بود.اگرچه روش سنتی در این مطالعه کمی دقیق‌تر بود، اما نتیجه‌گیری اینکه آیا چنین تفاوت کوچکی اهمیت بالینی یا عملی دارد دشوار است.این نتایج نشان می دهد که دقت تخمین سن دندانی با استفاده از مدل DM تقریباً با روش سنتی یکسان است.مقایسه مستقیم با نتایج مطالعات قبلی دشوار است زیرا هیچ مطالعه ای دقت مدل های DM را با روش های آماری سنتی با استفاده از تکنیک مشابه ثبت دندان ها در محدوده سنی مشابه در این مطالعه مقایسه نکرده است.گالیبورگ و همکاران 24 MAE و RMSE را بین دو روش سنتی (روش دمیرجیان 25 و روش ویلمز 29) و مدل 10 DM در یک جمعیت فرانسوی 2 تا 24 ساله مقایسه کردند.آنها گزارش دادند که تمام مدل‌های DM دقیق‌تر از روش‌های سنتی بودند، با تفاوت‌های 0.20 و 0.38 سال در MAE و 0.25 و 0.47 سال در RMSE در مقایسه با روش‌های Willems و Demirdjian.اختلاف بین مدل SD و روش‌های سنتی نشان‌داده‌شده در مطالعه Halibourg، گزارش‌های متعددی را در نظر می‌گیرد30،31،32،33 مبنی بر اینکه روش Demirdjian به‌طور دقیق سن دندانی را در جمعیت‌هایی غیر از کانادایی‌های فرانسوی که مطالعه بر اساس آن انجام شده است، تخمین نمی‌زند.در این مطالعه.تای و همکاران 34 از الگوریتم MLP برای پیش بینی سن دندان از 1636 عکس ارتودنسی چینی استفاده کردند و دقت آن را با نتایج روش Demirjian و Willems مقایسه کردند.آنها گزارش دادند که MLP از دقت بالاتری نسبت به روش های سنتی برخوردار است.تفاوت روش دمیرجیان با روش سنتی <0.32 سال و روش ویلمز 0.28 سال است که مشابه نتایج تحقیق حاضر است.نتایج این مطالعات قبلی24،34 نیز با نتایج مطالعه حاضر مطابقت دارد و دقت تخمین سنی مدل DM و روش سنتی مشابه است.با این حال، بر اساس نتایج ارائه شده، تنها با احتیاط می‌توان نتیجه گرفت که استفاده از مدل‌های DM برای تخمین سن ممکن است جایگزین روش‌های موجود به دلیل عدم وجود مطالعات مقایسه‌ای و مرجع قبلی شود.مطالعات بعدی با استفاده از نمونه های بزرگتر برای تایید نتایج به دست آمده در این مطالعه مورد نیاز است.
در میان مطالعاتی که دقت SD را در تخمین سن دندانی آزمایش می‌کنند، برخی دقت بالاتری نسبت به مطالعه ما نشان دادند.استپانوفسکی و همکاران 35 22 مدل SD را برای رادیوگرافی پانورامیک 976 ساکن چک در سنین 2.7 تا 20.5 سال اعمال کردند و دقت هر مدل را آزمایش کردند.آنها رشد 16 دندان دائمی سمت چپ بالا و پایین را با استفاده از معیارهای طبقه بندی پیشنهاد شده توسط Moorrees و همکاران (36) ارزیابی کردند.محدوده MAE از 0.64 تا 0.94 سال و محدوده RMSE از 0.85 تا 1.27 سال است که دقت بیشتری نسبت به دو مدل DM مورد استفاده در این مطالعه دارد.Shen و همکاران 23 از روش Cameriere برای تخمین سن دندانی هفت دندان دائمی فک پایین در ساکنان چین شرقی 5 تا 13 ساله استفاده کردند و آن را با سنین برآورد شده با استفاده از رگرسیون خطی، SVM و RF مقایسه کردند.آنها نشان دادند که هر سه مدل DM در مقایسه با فرمول سنتی Cameriere دقت بالاتری دارند.MAE و RMSE در مطالعه شن کمتر از مدل DM در این مطالعه بود.افزایش دقت مطالعات استپانوفسکی و همکاران.35 و شن و همکاران.23 ممکن است به دلیل گنجاندن افراد جوانتر در نمونه های مطالعه آنها باشد.از آنجایی که تخمین های سنی برای شرکت کنندگان با دندان های در حال رشد با افزایش تعداد دندان ها در طول رشد دندان دقیق تر می شود، دقت روش تخمین سن حاصل ممکن است زمانی که شرکت کنندگان در مطالعه جوان تر هستند به خطر بیفتد.علاوه بر این، خطای MLP در تخمین سن کمی کوچکتر از SLP است، به این معنی که MLP دقیق تر از SLP است.MLP برای تخمین سن کمی بهتر در نظر گرفته می شود، احتمالاً به دلیل لایه های پنهان در MLP38.با این حال، یک استثنا برای نمونه بیرونی زنان وجود دارد (SLP 1.45، MLP 1.49).این یافته که MLP در ارزیابی سن دقیق تر از SLP است، نیاز به مطالعات گذشته نگر اضافی دارد.
عملکرد طبقه بندی مدل DM و روش سنتی در آستانه 18 ساله نیز مقایسه شد.همه مدل‌های SD آزمایش‌شده و روش‌های سنتی در مجموعه تست داخلی، سطوح تبعیض عملاً قابل قبولی را برای نمونه ۱۸ ساله نشان دادند.حساسیت برای مردان و زنان به ترتیب بیشتر از 87.7 درصد و 94.9 درصد و ویژگی بیشتر از 89.3 درصد و 84.7 درصد بود.AUROC تمام مدل های آزمایش شده نیز از 0.925 فراتر می رود.تا جایی که ما می دانیم، هیچ مطالعه ای عملکرد مدل DM را برای طبقه بندی 18 ساله بر اساس بلوغ دندانی آزمایش نکرده است.ما می توانیم نتایج این مطالعه را با عملکرد طبقه بندی مدل های یادگیری عمیق در رادیوگرافی پانورامیک مقایسه کنیم.گوو و همکاران 15 عملکرد طبقه بندی یک مدل یادگیری عمیق مبتنی بر CNN و یک روش دستی بر اساس روش دمیرجیان را برای یک آستانه سنی مشخص محاسبه کردند.حساسیت و ویژگی روش دستی به ترتیب 87.7% و 95.5% و حساسیت و ویژگی مدل CNN به ترتیب از 89.2% و 86.6% فراتر رفت.آنها به این نتیجه رسیدند که مدل های یادگیری عمیق می توانند جایگزین ارزیابی دستی در طبقه بندی آستانه های سنی شوند یا بهتر عمل کنند.نتایج این مطالعه عملکرد طبقه بندی مشابهی را نشان داد.اعتقاد بر این است که طبقه بندی با استفاده از مدل های DM می تواند جایگزین روش های آماری سنتی برای تخمین سن شود.در بین مدل ها، DM LR از نظر حساسیت برای نمونه مرد و حساسیت و ویژگی برای نمونه زن بهترین مدل بود.LR از نظر ویژگی برای مردان رتبه دوم را دارد.علاوه بر این، LR یکی از مدل‌های DM35 کاربرپسند به حساب می‌آید و پردازش آن کمتر پیچیده و دشوار است.بر اساس این نتایج، LR بهترین مدل طبقه بندی برش برای جوانان 18 ساله در جمعیت کره در نظر گرفته شد.
به طور کلی، دقت تخمین سن یا عملکرد طبقه‌بندی در مجموعه تست خارجی در مقایسه با نتایج روی مجموعه تست داخلی ضعیف یا کمتر بود.برخی گزارش‌ها نشان می‌دهند که دقت طبقه‌بندی یا کارایی زمانی کاهش می‌یابد که تخمین‌های سنی بر اساس جمعیت کره‌ای برای جمعیت ژاپنی ۵،۳۹ اعمال شود، و الگوی مشابهی در مطالعه حاضر پیدا شد.این روند زوال در مدل DM نیز مشاهده شد.بنابراین، برای تخمین دقیق سن، حتی در هنگام استفاده از DM در فرآیند تجزیه و تحلیل، روش‌های مشتق‌شده از داده‌های جمعیت بومی مانند روش‌های سنتی، باید ترجیح داده شوند5،39،40،41،42.از آنجایی که مشخص نیست که آیا مدل‌های یادگیری عمیق می‌توانند روندهای مشابهی را نشان دهند، مطالعاتی که دقت و کارایی طبقه‌بندی را با استفاده از روش‌های سنتی، مدل‌های DM و مدل‌های یادگیری عمیق بر روی همان نمونه‌ها مقایسه می‌کنند، مورد نیاز است تا تأیید شود که آیا هوش مصنوعی می‌تواند بر این تفاوت‌های نژادی در سن محدود غلبه کند یا خیر.ارزیابی ها
ما نشان می‌دهیم که روش‌های سنتی را می‌توان با تخمین سن بر اساس مدل DM در عمل تخمین سن پزشکی قانونی در کره جایگزین کرد.ما همچنین امکان اجرای یادگیری ماشینی را برای ارزیابی سن پزشکی قانونی کشف کردیم.با این حال، محدودیت‌های واضحی وجود دارد، مانند تعداد ناکافی شرکت‌کنندگان در این مطالعه برای تعیین قطعی نتایج، و عدم انجام مطالعات قبلی برای مقایسه و تأیید نتایج این مطالعه.در آینده، مطالعات DM باید با تعداد بیشتری از نمونه ها و جمعیت های متنوع تر انجام شود تا کاربرد عملی آن در مقایسه با روش های سنتی بهبود یابد.برای تایید امکان استفاده از هوش مصنوعی برای تخمین سن در چند جمعیت، مطالعات آینده برای مقایسه دقت طبقه‌بندی و کارایی مدل‌های DM و یادگیری عمیق با روش‌های سنتی در همان نمونه‌ها مورد نیاز است.
در این مطالعه از 2657 عکس املایی استفاده شد که از بزرگسالان کره ای و ژاپنی 15 تا 23 ساله جمع آوری شده بودند.رادیوگرافی های کره ای به 900 مجموعه تمرینی (65/2 ± 42/19 سال) و 900 مجموعه تست داخلی (59/2 ± 52/19 سال) تقسیم شدند.مجموعه آموزشی در یک موسسه (بیمارستان سنت مری سئول) و مجموعه آزمایشی خود در دو موسسه (بیمارستان دندانپزشکی دانشگاه ملی سئول و بیمارستان دندانپزشکی دانشگاه یونسی) جمع آوری شد.ما همچنین 857 رادیوگرافی را از داده‌های مبتنی بر جمعیت دیگر (دانشگاه پزشکی Iwate، ژاپن) برای آزمایش خارجی جمع‌آوری کردیم.رادیوگرافی افراد ژاپنی (60/2 ± 31/19 سال) به عنوان مجموعه تست خارجی انتخاب شد.داده ها به صورت گذشته نگر برای تجزیه و تحلیل مراحل رشد دندان در رادیوگرافی پانورامیک گرفته شده در طول درمان دندان جمع آوری شد.تمام اطلاعات جمع آوری شده به جز جنسیت، تاریخ تولد و تاریخ رادیوگرافی ناشناس بود.معیارهای ورود و خروج مانند مطالعات منتشر شده قبلی 4 و 5 بود.سن واقعی نمونه با کم کردن تاریخ تولد از تاریخ رادیوگرافی محاسبه شد.گروه نمونه به 9 گروه سنی تقسیم شدند.توزیع سن و جنس در جدول 3 نشان داده شده است. این مطالعه مطابق با اعلامیه هلسینکی انجام شد و توسط هیئت بررسی نهادی (IRB) بیمارستان سنت مری سئول دانشگاه کاتولیک کره (KC22WISI0328) تایید شد.با توجه به طراحی گذشته نگر این مطالعه، رضایت آگاهانه از همه بیمارانی که برای اهداف درمانی تحت معاینه رادیوگرافیک قرار می گیرند، اخذ نشد.بیمارستان سنت ماری دانشگاه کره سئول (IRB) از شرط رضایت آگاهانه چشم پوشی کرد.
مراحل رشد دندان های مولر دوم و سوم دو فک بالا بر اساس معیارهای دمیرکان ارزیابی شد.تنها یک دندان در صورتی انتخاب می شد که همان نوع دندان در سمت چپ و راست هر فک یافت شود.اگر دندان‌های همولوگ در هر دو طرف در مراحل رشد متفاوتی بودند، دندان با مرحله رشد پایین‌تر برای در نظر گرفتن عدم قطعیت در سن تخمینی انتخاب شد.صد رادیوگرافی به طور تصادفی انتخاب شده از مجموعه آموزشی توسط دو ناظر مجرب برای تست پایایی بین مشاهده‌گر پس از پیش کالیبراسیون برای تعیین مرحله بلوغ دندانی نمره‌گذاری شد.پایایی درون ناظر دو بار در فواصل سه ماهه توسط ناظر اولیه ارزیابی شد.
جنسیت و مرحله رشد مولرهای دوم و سوم هر فک در مجموعه تمرینی توسط ناظر اولیه آموزش دیده با مدل های مختلف DM تخمین زده شد و سن واقعی به عنوان مقدار هدف تعیین شد.مدل‌های SLP و MLP، که به طور گسترده در یادگیری ماشین استفاده می‌شوند، در برابر الگوریتم‌های رگرسیون آزمایش شدند.مدل DM توابع خطی را با استفاده از مراحل رشد چهار دندان ترکیب می کند و این داده ها را برای تخمین سن ترکیب می کند.SLP ساده ترین شبکه عصبی است و حاوی لایه های پنهان نیست.SLP بر اساس انتقال آستانه بین گره ها کار می کند.مدل SLP در رگرسیون از نظر ریاضی شبیه به رگرسیون خطی چندگانه است.برخلاف مدل SLP، مدل MLP دارای چندین لایه پنهان با توابع فعال سازی غیرخطی است.آزمایش‌های ما از یک لایه پنهان تنها با 20 گره پنهان با توابع فعال‌سازی غیرخطی استفاده کردند.از شیب نزول به عنوان روش بهینه سازی و MAE و RMSE به عنوان تابع ضرر برای آموزش مدل یادگیری ماشین خود استفاده کنید.بهترین مدل رگرسیون به‌دست‌آمده در مجموعه تست‌های داخلی و خارجی اعمال شد و سن دندان‌ها برآورد شد.
یک الگوریتم طبقه بندی توسعه داده شد که از بلوغ چهار دندان در مجموعه آموزشی برای پیش بینی اینکه آیا یک نمونه 18 ساله است یا خیر، استفاده می کند.برای ساخت این مدل، ما هفت الگوریتم یادگیری ماشین را به نمایش گذاشتیم: (1) LR، (2) KNN، (3) SVM، (4) DT، (5) RF، (6) XGBoost، و (7) MLP .LR یکی از پرکاربردترین الگوریتم های طبقه بندی است.این یک الگوریتم یادگیری نظارت شده است که از رگرسیون برای پیش‌بینی احتمال داده‌های متعلق به یک دسته خاص از 0 تا 1 استفاده می‌کند و بر اساس این احتمال، داده‌ها را به عنوان متعلق به دسته‌ای محتمل‌تر طبقه‌بندی می‌کند.عمدتا برای طبقه بندی باینری استفاده می شود.KNN یکی از ساده ترین الگوریتم های یادگیری ماشینی است.هنگامی که داده های ورودی جدید داده می شود، k داده را نزدیک به مجموعه موجود می یابد و سپس آنها را در کلاس با بالاترین فرکانس طبقه بندی می کند.برای تعداد همسایه های در نظر گرفته شده (k) عدد 3 را تعیین می کنیم.SVM الگوریتمی است که فاصله بین دو کلاس را با استفاده از یک تابع هسته برای گسترش فضای خطی به فضای غیر خطی به نام fields46 به حداکثر می رساند.برای این مدل، از بایاس = 1، توان = 1 و گاما = 1 به عنوان ابرپارامتر برای هسته چند جمله ای استفاده می کنیم.DT در زمینه های مختلف به عنوان الگوریتمی برای تقسیم کل مجموعه داده به چندین زیر گروه با نمایش قوانین تصمیم گیری در یک ساختار درختی استفاده شده است.این مدل با حداقل تعداد رکورد در هر گره 2 پیکربندی شده است و از شاخص جینی به عنوان معیار کیفیت استفاده می کند.RF یک روش مجموعه‌ای است که چندین DT را برای بهبود عملکرد با استفاده از روش تجمع راه‌اندازی ترکیب می‌کند که یک طبقه‌بندی ضعیف برای هر نمونه با کشیدن نمونه‌هایی با اندازه یکسان چندین بار از مجموعه داده اصلی ایجاد می‌کند.ما از 100 درخت، 10 عمق درخت، 1 حداقل اندازه گره و شاخص ترکیبی جینی به عنوان معیار جداسازی گره استفاده کردیم.طبقه بندی داده های جدید با اکثریت آرا تعیین می شود.XGBoost الگوریتمی است که تکنیک‌های تقویت را با استفاده از روشی ترکیب می‌کند که خطای بین مقادیر واقعی و پیش‌بینی‌شده مدل قبلی را به عنوان داده آموزشی می‌گیرد و با استفاده از گرادیان‌ها خطا را افزایش می‌دهد.این الگوریتم به دلیل عملکرد خوب و کارایی منابع و همچنین قابلیت اطمینان بالا به عنوان یک تابع اصلاح بیش از حد، یک الگوریتم پرکاربرد است.این مدل به 400 چرخ پشتیبانی مجهز شده است.MLP یک شبکه عصبی است که در آن یک یا چند پرسپترون چندین لایه با یک یا چند لایه پنهان بین لایه های ورودی و خروجی تشکیل می دهند.با استفاده از این، می‌توانید طبقه‌بندی غیرخطی را انجام دهید، جایی که وقتی یک لایه ورودی اضافه می‌کنید و مقدار نتیجه را دریافت می‌کنید، مقدار نتیجه پیش‌بینی‌شده با مقدار نتیجه واقعی مقایسه می‌شود و خطا دوباره منتشر می‌شود.ما یک لایه پنهان با 20 نورون مخفی در هر لایه ایجاد کردیم.هر مدلی که ما ایجاد کردیم برای آزمایش عملکرد طبقه‌بندی با محاسبه حساسیت، ویژگی، PPV، NPV و AUROC برای مجموعه‌های داخلی و خارجی اعمال شد.حساسیت به عنوان نسبت یک نمونه 18 ساله یا بالاتر به نمونه ای که 18 سال یا بالاتر تخمین زده می شود، تعریف می شود.ویژگی نسبت نمونه های زیر 18 سال و نمونه هایی است که کمتر از 18 سال تخمین زده می شود.
مراحل دندانپزشکی ارزیابی شده در مجموعه آموزشی برای تجزیه و تحلیل آماری به مراحل عددی تبدیل شدند.رگرسیون خطی و لجستیک چند متغیره برای توسعه مدل‌های پیش‌بینی برای هر جنس و استخراج فرمول‌های رگرسیون که می‌تواند برای تخمین سن استفاده شود، انجام شد.ما از این فرمول ها برای تخمین سن دندان برای هر دو مجموعه تست داخلی و خارجی استفاده کردیم.جدول 4 مدل های رگرسیون و طبقه بندی مورد استفاده در این مطالعه را نشان می دهد.
پایایی درون و بین ناظر با استفاده از آماره کاپا کوهن محاسبه شد.برای آزمایش دقت مدل‌های DM و رگرسیون سنتی، ما MAE و RMSE را با استفاده از سن تخمینی و واقعی مجموعه‌های تست داخلی و خارجی محاسبه کردیم.این خطاها معمولاً برای ارزیابی دقت پیش‌بینی‌های مدل استفاده می‌شوند.هر چه خطا کمتر باشد، دقت پیش بینی بیشتر می شود.MAE و RMSE مجموعه های تست داخلی و خارجی محاسبه شده با استفاده از DM و رگرسیون سنتی را مقایسه کنید.عملکرد طبقه بندی برش 18 ساله در آمار سنتی با استفاده از جدول احتمالی 2 × 2 ارزیابی شد.حساسیت محاسبه شده، ویژگی، PPV، NPV و AUROC مجموعه آزمون با مقادیر اندازه گیری شده مدل طبقه بندی DM مقایسه شد.داده ها بسته به ویژگی های داده به صورت میانگین ± انحراف استاندارد یا عدد (%) بیان می شوند.مقادیر P دو طرفه <0.05 از نظر آماری معنی دار در نظر گرفته شد.تمام تجزیه و تحلیل های آماری معمول با استفاده از SAS نسخه 9.4 (SAS Institute, Cary, NC) انجام شد.مدل رگرسیون DM در پایتون با استفاده از Keras50 2.2.4 Backend و Tensorflow51 1.8.0 به طور خاص برای عملیات ریاضی پیاده سازی شد.مدل طبقه‌بندی DM در محیط تحلیل دانش Waikato و پلت فرم تحلیل اطلاعات Konstanz (KNIME) 4.6.152 پیاده‌سازی شد.
نویسندگان اذعان می کنند که داده های حمایت کننده از نتایج مطالعه را می توان در مقاله و مواد تکمیلی یافت.مجموعه داده‌های تولید شده و/یا تجزیه‌وتحلیل‌شده در طول مطالعه در صورت درخواست معقول از نویسنده مربوطه در دسترس است.
Ritz-Timme، S. et al.ارزیابی سن: وضعیت هنر برای برآوردن الزامات خاص عمل پزشکی قانونی.بین المللی بودنJ. پزشکی قانونی.113، 129-136 (2000).
Schmeling، A.، Reisinger، W.، Geserik، G.، و Olze، A. وضعیت فعلی ارزیابی سن پزشکی قانونی افراد زنده برای اهداف تعقیب کیفری.پزشکی قانونیدارو.آسيب شناسي.1، 239-246 (2005).
پان، جی و همکاران.روشی اصلاح شده برای ارزیابی سن دندانی کودکان 5 تا 16 ساله در شرق چین.بالینینظرسنجی شفاهی25، 3463-3474 (2021).
لی، اس اس و غیره. گاه‌شماری رشد دندان‌های مولر دوم و سوم در کره‌ای‌ها و کاربرد آن برای ارزیابی سن پزشکی قانونی.بین المللی بودنJ. پزشکی قانونی.124، 659-665 (2010).
Oh, S., Kumagai, A., Kim, SY and Lee, SS دقت تخمین سن و تخمین آستانه 18 ساله بر اساس بلوغ مولر دوم و سوم در کره ای ها و ژاپنی ها.PLoS ONE 17، e0271247 (2022).
کیم، جی وای و همکارانتجزیه و تحلیل داده های مبتنی بر یادگیری ماشین قبل از عمل می تواند نتیجه درمان جراحی خواب را در بیماران مبتلا به OSA پیش بینی کند.علم.گزارش 11, 14911 (2021).
هان، ام و همکارانتخمین سنی دقیق از یادگیری ماشین با یا بدون دخالت انسان؟بین المللی بودنJ. پزشکی قانونی.136, 821-831 (2022).
خان، س. و شاهین، م. از داده کاوی تا داده کاوی.J. اطلاعات.علم.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. and Shaheen, M. WisRule: The First Algorithm Cognitive for Association Rule Mining.J. اطلاعات.علم.https://doi.org/10.1177/01655515221108695 (2022).
شاهین ام و عبدالله یو کارم: داده کاوی سنتی بر اساس قوانین انجمن مبتنی بر زمینه.محاسبه.مت.ادامه هید.68, 3305–3322 (2021).
محمد م.، رحمان ز، شاهین م.، خان م. و حبیب م. تشخیص تشابه معنایی مبتنی بر یادگیری عمیق با استفاده از داده های متنی.آگاه کردن.فن آوری هاکنترل.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
تابیش، م، تنولی، ز، و شاهین، م. سیستمی برای تشخیص فعالیت در ویدئوهای ورزشی.چند رسانه ای.برنامه های کاربردی ابزار https://doi.org/10.1007/s11042-021-10519-6 (2021).
حلبی، اس اس و همکاران.چالش یادگیری ماشین RSNA در عصر استخوان کودکان.رادیولوژی 290، 498-503 (2019).
لی، ی و همکارانتخمین سن پزشکی قانونی از اشعه ایکس لگن با استفاده از یادگیری عمیقیوروتابش - تشعشع.29، 2322–2329 (2019).
Guo، YC، و همکاران.طبقه‌بندی سنی دقیق با استفاده از روش‌های دستی و شبکه‌های عصبی کانولوشنال عمیق از تصاویر پیش‌بینی املایی.بین المللی بودنJ. پزشکی قانونی.135، 1589-1597 (2021).
آلاباما دالورا و همکارانتخمین سن استخوان با استفاده از روش‌های مختلف یادگیری ماشین: مروری بر ادبیات سیستماتیک و متاآنالیزPLoS ONE 14, e0220242 (2019).
Du، H.، Li، G.، Cheng، K.، و Yang، J. تخمین سنی جمعیت آفریقایی آمریکایی و چینی بر اساس حجم اتاقک پالپ مولرهای اول با استفاده از توموگرافی کامپیوتری با پرتو مخروطی.بین المللی بودنJ. پزشکی قانونی.136, 811-819 (2022).
Kim S.، Lee YH، Noh YK، Park FK و Oh KS تعیین گروه‌های سنی افراد زنده با استفاده از تصاویر مبتنی بر هوش مصنوعی از دندان‌های آسیاب اول.علم.گزارش 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., and Urschler, M. تخمین سنی خودکار و طبقه بندی سن اکثریت از داده های MRI چند متغیره.IEEE J. Biomed.هشدارهای بهداشتی23، 1392–1403 (2019).
Cheng، Q.، Ge، Z.، Du، H. و Li، G. تخمین سن بر اساس تقسیم بندی اتاقک پالپ سه بعدی مولرهای اول از توموگرافی کامپیوتری پرتو مخروطی با ادغام مجموعه های یادگیری عمیق و سطح.بین المللی بودنJ. پزشکی قانونی.135، 365-373 (2021).
Wu، WT، و همکاران.داده کاوی در کلان داده های بالینی: پایگاه های داده رایج، مراحل و مدل های روش.جهان.دارو.منبع8، 44 (2021).
یانگ، جی و همکاران.مقدمه ای بر پایگاه های داده پزشکی و فناوری های داده کاوی در عصر کلان داده.جی. آوید.طب پایه.13، 57-69 (2020).
شن، اس و همکاران.روش Camerer برای تخمین سن دندان با استفاده از یادگیری ماشین.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.مقایسه روش‌های مختلف یادگیری ماشین برای پیش‌بینی سن دندانی با استفاده از روش مرحله‌بندی دمیرجیان.بین المللی بودنJ. پزشکی قانونی.135، 665-675 (2021).
Demirdjian, A., Goldstein, H. and Tanner, JM یک سیستم جدید برای ارزیابی سن دندانی.خرخر کردنزیست شناسی45, 211-227 (1973).
Landis, JR, and Koch, GG اندازه گیری توافق ناظر بر روی داده های طبقه بندی شده.بیومتریک 33، 159-174 (1977).
Bhattacharjee S، Prakash D، Kim C، Kim HK و Choi HK.تحلیل بافتی، مورفولوژیکی و آماری تصویربرداری تشدید مغناطیسی دو بعدی با استفاده از تکنیک‌های هوش مصنوعی برای تمایز تومورهای اولیه مغزی.اطلاعات بهداشتی.منبعhttps://doi.org/10.4258/hir.2022.28.1.46 (2022).


زمان ارسال: ژانویه-04-2024