صفحه محصول - پروپوزال پایان نامه داده کاوی در ارزیابی ریسک حوادث

توضیحات

پروپوزال پایان نامه داده کاوی در ارزیابی ریسک حوادث (docx) 1 صفحه

دسته بندی : تحقیق

نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )

تعداد صفحات: 1 صفحه

قسمتی از متن Word (.docx) :

پایان نامه کارشناسی ارشد مهندسی فناوری اطلاعات مدلی جدید برای ارزیابی ریسک حوادث ناشی از کار و بهبود ایمنی کار با استفاده از تکنیکهای دادهکاوی؛ موردکاوی: دادههای استان قم استاد راهنما: آقای دکتر بهروز مینایی بیدگلی استاد مشاور: آقای مهندس جعفر پور امینی نگارش: مریم سادات حاج اکبری 6 / 90 بسمه تعالی اظهارنامه (اصالت اثر) اینجانب مریم سادات حاج اکبری دانشجوی‌ رشته مهندسی فناوری اطلاعات گرایش تجارت الکترونیک مؤسسه غیرانتفاعی مجازی نورطوبی اظهار می کنم که این پایان نامه حاصل پژوهش خودم بوده و در جاهایی که از منابع دیگران استفاده کردهام، نشانی دقیق و مشخصات کامل آن را نوشتهام.همچنین اظهار میکنم که تحقیق و موضوع پایان نامهام تکراری نیست و تعهد مینمایم که بدون مجوز دانشگاه دستاوردهای آن را منتشر ننموده و یا در اختیار غیر ندهم. کلیه حقوق این اثر مطابق با آیین نامه مالکیت فکری و معنوی متعلق به مؤسسه آموزش عالی نورطوبی است. نام و نام خانوادگی: مریم سادات حاج اکبری تاریخ و امضاء: تقدیم به پدر و مادر عزیزم سپاسگزاری اینک که فرآیند پرپیچ و خم پایاننامهام، به پایان خود نزدیک شده است، چون نیک مینگرم برایم مسلم میشود که اگر راهنماییهای مشفقانه استاد گرامیم جناب آقای دکتر بهروز مینایی بیدگلی و مشاور ارجمند آقای مهندس پورامینی نبود، هرگز نمیتوانستم به نتیجه مطلوب برسم. با اینحال نمیتوانم همکاریهای صمیمانه مسئولینی همچون آقایان ابوالفضل شاهدی علیآبادی، رئیس بازرسین استان قم و مجید گلفشان بازرس محترم سازمان کار و اموراجتماعی را نادیده بگیرم. چکیده مدلی جدید برای ارزیابی ریسک حوادث ناشی از کار و بهبود ایمنی کار با استفاده از تکنیکهای دادهکاوی؛ موردکاوی: استان قم نگارنده: مریم سادات حاجاکبری پیشگیری حوادث ناشی از کار یا علاج قبل از وقوع، قولی است که تمام صاحبنظران و دست اندرکاران مسایل کار و روابط صنعتی و اشخاص منصف به آن اعتقاد دارند و در قرن اخیر با پیشرفت و گسترش روز افزون ماشینآلات و صنعت در کلیه شئون اجتماعی و اقتصادی اهمیت این نکته بیش از پیش محسوس شده است. شناسایی نقاط پرریسک و حادثهپذیر میتواند به عنوان روشي براي افزايش دانش پيشگيري از حوادث بكار روند. هدف این تحقیق، استفاده از ابزار دادهکاوی، جهت ایجاد مدلی جدید برای ارزیابی ریسک حوادث ناشی از کار میباشد. بدین منظور از دادههای پایگاه داده، وزارتکار و امور اجتماعی استفاده شدهاست. نتایج نشان میدهند که این مدل میتواند با دقت بالایی نقاط ریسکپذیر را شناسایی و تحلیل نماید. فهرست مطالب عنوان فصل اول: کلیات تحقیق11-1- مقدمه12-1- اهميت و ضرورت انجام تحقیق23-1- جنبه جدید بودن و نوآوری تحقیق24-1- قلمرو تحقیق(زمانی، مکانی، موضوعی)31-4-1- قلمرو زمانی تحقیق32-4-1- قلمرو مکانی تحقیق33-4-1- قلمرو موضوعی تحقیق45-1- ساختار پایاننامه4فصل دوم: مبانی نظری تحقیق51-2- مقدمه52-2- نظریههای مختلف مرتبط با ارزیابی ریسک61-2-2- ارزیابی کمی ریسک62-2-1- ارزیابی کیفی ریسک 63-2- روشهای ارزیابی ریسک71-3-2- چند نمونه از روشهای ارزیابی ریسک74-2- چارچوب مدل فرضی 85-2- مفاهیم و متغیرهای مهم91-5-2- حوادث ناشی از کار 92-5-2- علل حوادث ناشی از کار91-2-5-2- علل مستقیم92-2-5-2- علل غیر مستقیم103-5-2- حادثه101-3-5-2- حادثه خفیف102-3-5-2- حادثه شديد103-3-5-2- شبه حادثه114-5-2- حادثهپذيري115-5-2- حادثهپذير116-5-2- خطر121-6-5-2- خطرات آنی122-6-5-2- خطرات آتی127-5-2- مخاطره128-5-2- ايمني131-8-5-2- ايمني سيستم 132-8-5-2- تحلیل ايمني سيستم139-5-2- بازرس 1410-5-2- بازرسی141-10-5-2- بازرسی ادواری142-10-5-2- بازرسی موردی1511-5-2- کمیتهی حفاظت فنی و بهداشت151-11-5-2- وظیفهی کمیتهی حفاظت فنی و بهداشت1512-5-2- مسئول ایمنی1513-5-2- بیمهی مسئولیت مدنی1614-5-2- ريسک161-14-5-2- ارزیابی ريسک1615-5-2- ضرايب ارزيابي حوادث171-15-5-2- ضريب تکرار حادثه172-15-5-2- ضريب شدت حادثه173-15-5-2- ضريب وقوع حادثه1816-5-2- دادهکاوي181-16-5-2- اهداف دادهکاوي186-2- پایگاهدادههای حوادث197-2- تکنيکهاي دادهکاوي در تحليل پايگاهدادههای حوادث211-7-2- تکنيکهاي کلاسيک211-1-7-2- آمار212-1-7-2- مدلهای رگرسیون223-1-7-2- نزدیکترین همسایگی222-7-2- تکنيکهاي نسل بعدي221-2-7-2- درخت تصمیمگیری222-2-7-2- قوانین انجمنی238-2- تکنيکهاي دادهکاوي استفاده شده دراین تحقیق251-8-2- ردهبندی252-8-2- خوشهبندی269-2- سوالات اساسی در این پژوهش261-9-2- سوالات اصلی تحقیق262-9-2- سوالات فرعی تحقیق2710-2- مرورادبیات27فصل سوم: روش تحقیق321-3- مقدمه322-3- مفاهیم مورد نیاز331-2-3- الگوریتمK-means 332-2-3- الگوریتم C5.0333-2-3- الگوریتم CHAID344-2-3- الگوریتم C&RTree345-2-3- الگوریتم QUEST356-2-3- معیارهای ارزیابی357-2-3- مدل RFM 373-3- روند انجام کار381-3-3- درک داده382-3-3- پیش پردازش داده391-2-3-3- رفع آنومالی اشتباه بازرس402-2-3-3- داده غلط413-2-3-3- داده مغشوش414-2-3-3- داده از دست رفته413-3-3- مدل جدید DFSRM421-3-3-3- چارچوب مدل DFSRM422-3-3-3- مزایای اصلی مدل433-3-3-3- مفهوم هریک از حروف مدل DFSRM444-3-3-3- متغیرهای اصلی مدل444-3-3- شناسایی حادثهپذیرترین کارگاهها451-4-3-3- محاسبهی متغیرهای مدل DFSRM462-4-3-3- نرمالسازی513-4-3-3- خوشهبندی524-4-3-3- تعیین سطح ریسک برای هرخوشه545-4-3-3- بررسی حالتهای مختلف551-5-4-3-3- قوانین استخراج شده از مدلهای درخت تصمیمگیری(حالت اول)571-1-5-4-3-3- تحلیل کدکارگاههای 504 و 3713 با سطح ریسک شدید582-5-4-3-3- قوانین استخراج شده از مدلهای درخت تصمیمگیری(حالت دوم)603-5-4-3-3- قوانین استخراج شده از مدلهای درخت تصمیمگیری(حالت سوم)615-3-3- کاربرد مدل DFSRM621-5-3-3- پیشنهاد بازرسی ادواری برای سال 90622-5-3-3- شناسایی حادثهپذیرترین کارگاهها(سال 88 و 89)633-5-3-3- پیادهسازی مدل DFSRM634-5-3-3- تحلیل و بررسی نتایج67فصل چهارم: بحث و بررسی و تحلیل دادهها711-4- مقدمه71 2-4- شمایی از جداول وزارت کار72 1-2-4- جدول کارگاه72 2-2-4- جدول حادثه74 3-2-4- جدول حادثهدیده77 3-4- نتایج بررسی آماری حوادث ناشی از کار در استان قم804-4- آمار، براساس سایت سازمان جهانی کار(ILO)89فصل پنجم: نتایج و پیشنهادها931-5- مقدمه932-5- ارزیابی عملکرد درختهای تصمیمگیری 931-2-5- دقت مدلهای CHAID، QUEST، C&Rtree و C5(حالت اول)942-2-5- محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت اول)963-2-5- دقت مدلهای CHAID، QUEST، C&Rtree و C5(حالت دوم)984-2-5- محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت دوم)1005-2-5- دقت مدلهای CHAID، QUEST، C&Rtree و C5(حالت سوم)1026-2-5- محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت سوم)1043-5- نتیجهگیری نهایی1064-5- پیشنهادها و اشکالات نرمافزار1076-5- محدودیتها و موانع پژوهش1117-5- منابع112 فهرست جداول عنوان جدول 1-2: مرورادبیات31 جدول 1-3: ماتریس اغتشاش برای مسائل دوردهای37 جدول2-3: رفع اشتباه بازرسین41جدول3-3: اصلاح فیلد تعداد افراد حادثهدیده42جدول4-3: مشاغل سخت و زیانآور و عادی46جدول5-3: تفکیک فعالیتهای برق و صنعت به دودسته سخت و زیانآور و عادی47جدول6-3: جدول استاندارد برای محاسبه تعداد روزهای از دست رفته معادل48جدول7-3: محل آسیب فرد حادثهدیده49جدول8-3: سختی حادثه50جدول9-3: مقادیر متغیرهای مدل DFSRM50جدول10-3: نرمال سازی متغیرهای مدل DFSRM51جدول11-3: مقادیر SSE در هرخوشه52جدول12-3: مقادیر Di برای هرخوشه و تعیین سطح ریسک53جدول13-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند54جدول14-3: تقسیم بندی سطح ریسک در حالت اول55جدول15-3: اطلاعات مربوط به وضعیت دو کارگاه 504 و371356جدول16-3: تقسیمبندی سطح ریسک در حالت دوم59جدول17-3: تقسیمبندی سطح ریسک در حالت سوم59جدول18-3: مقادیر متغیرهای مدل DFSRM- سال8860جدول19-3: مقادیر متغیرهای مدل DFSRM- سال 8963جدول20-3: نرمالسازی متغیرهای مدل DFSRM- سال8864جدول21-3: نرمالسازی متغیرهای مدل DFSRM- سال 8964جدول22-3: مقادیر SSE برای هر خوشه- سال8864جدول23-3: مقادیر SSE برای هر خوشه- سال8965جدول24-3: مقادیر Di برای هر خوشه و تعیین سطح ریسک- سال8865جدول25-3: مقادیر Di برای هر خوشه و تعیین سطح ریسک- سال8966جدول26-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند- سال8866جدول27-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند- سال8967جدول28-3: کد کارگاههایی که در سال 90 نیاز به بازرسی دارند67جدول29-3: وضعیت کارگاههایی که به عنوان نقاط بحرانی شناسایی شدهاند67جدول30-3: بررسی حوادث، کارگاههایی که به عنوان نقاط بحرانی شناخته شدهاند68جدول31-3: بررسی حوادث در کارگاههایی که به عنوان نقاط بحرانی شناخته شدهاند69جدول1-4: کارگاه72جدول1-1-4: وضع کارگاه73جدول2-1-4: وضع ساعت کار73جدول3-1-4: وضع حقوقی73جدول4-1-4: مجوز، بیمهی مدنی، مسئول ایمنی و غیره73جدول5-1-4: وضع رفاهی74جدول2-4: حادثه75جدول1-2-4: عامل وقوع حادثه75جدول2-2-4: علت وقوع حادثه76جدول3-2-4: اطلاع اداره، اطلاع سازمان و غیره76جدول4-2-4: نوبتکاری77جدول5-2-4: محل آسیب فرد حادثهدیده77جدول3-4: حادثهدیده78جدول1-3-4: مدرک79جدول2-3-4: تاهل، ملیت، جنسیت و غیره79جدول3-3-4: نتیجه حادثه79جدول4-4: بخشی از جدول حادثهدیده، افراد پرریسک83جدول5-4: بخشی از جدول حادثه، افراد پرریسک84جدول6-4:گزارش حادثه آقای ع.آ86جدول7-4: گزارش یک حادثه که در آن 5 نفر مصدوم شدند87جدول8-4: کد کارگاههایی که بیش از یک حادثه فوتی داشتند88جدول9-4: توزیع تعداد موارد مرگ و میر از سال 1371 تا 138988جدول10-4: بررسی آمار حوادث در سه بعد نیرویکار، محیطکار و شرایطکاری90جدول1-5: مقایسهی دقت عملکرد مدلهای درخت تصمیمگیری(حالت اول)94جدول 2-5: محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت اول)96جدول3-5: مقایسهی دقت عملکرد مدلهای درخت تصمیمگیری(حالت دوم)98جدول 4-5: محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت دوم)100جدول5-5: مقایسهی دقت عملکرد مدلهای درخت تصمیمگیری(حالت سوم)102جدول 6-5: محاسبهیRecall ،Accuracy ،Precision و F-measure(حالت سوم)104جدول7-5: نتیجه نهایی عملکرد مدلها در هرسه حالت106 فهرست شکلها و نمودارها عنوان شکل 1-2: درخت تصمیمگیری23شکل 1-3: روند انجامکار 38شکل2-3: چارچوب مدلDFSRM 42شکل3-3: نمودار SSE، برای نمایش K بهینه53شکل4-3: نمودار SSE، برای نمایش K بهینه- سال8865شکل5-3: نمودار SSE، برای نمایش K بهینه- سال8966شکل1-4: 2947کارگاه در استان قم در بخش صنعت و تولید فعالیت میکنند80شکل2-4: از سال 1385 تا 1389، 660 حادثه به ثبت رسیده است80شکل3-4: از سال 1385 تا 1389، 80 کارگاه بیش از 2 حادثه داشتند81شکل4-4: سالهای 88، 89 و 87 پرحادثهترین سالها هستند82شکل5-4: کد کارگاههایی که در آنها بیش از یک نفر مصدوم شدهاند87 فصل اول: کلیات تحقیق مقدمه: توسعهی صنعت و پیشرفت فنآوری در کنار آثار مثبت و ارزشمند خود با آثار و عوارض ناگواری نیز همراه بوده است. عوارضی نظیر افزایش آلودگیهای محیطی، افزایش حوادث و بیماریهای ناشی از کار، از جمله پیامدهایی هستند که بیش از پیش زندگی انسان و به ویژه سلامت کارکنان را مورد تهدید قرار داده است. البته این امر در کشورهای در حال توسعه که به منظور افزایش تولید، بدون در نظر گرفتن اصول ایمنی، استاندارهای ساعت کار، آموزش کارگران و استفاده از لوازم حفاظت فردی مناسب، بر کارگران فشار زیادی وارد میکنند بیشتر نمود پیدا میکند و باعث بروز حوادث جبران ناپذیری میشود. بر طبق‌ آمار منتشر شده‌ در كشورهاي‌ پيشرفته‌ صنعتي‌، سالانه‌ از هر ده‌ نفر كارگر يكي‌ دچار سانحه‌ مي‌شود که در نتیجه آن پنج‌ درصد روزهاي‌ كار ملي‌ به هدر میرود. کشور ایران نیز که در راه توسعه و صنعتی شدن گام برمیدارد از این قاعده مستثنی نیست. در نتیجه اگر بتوانیم نقاط پرریسک و خطرپذیر را شناسایی نموده و به تجزیه و تحلیل آنها بپردازیم، خواهیم توانست گامی موثر در جهت افزایش دانش پیشگیری از حوادث برداریم. 2-1- اهمیت و ضرورت انجام کار: در بین تمامی مقالات جستجو شده در مجلات معتبر داخلی و خارجی و همچنین مصاحبه با افراد خبره، مشخص شد که تاکنون هیچ گونه تحقیقی در ارتباط با حوادث ناشی از کار و یا مدیریت ریسک حوادث، با استفاده از تکنیکهای دادهکاوی در این سطح ارائه نشدهاست. تحقیقات انجام شده در نشریات معتبر خارجی نیز حاکی از آن است که در ارتباط با ارزیابی ریسک حوادث، تحقیقاتی به صورت محدود صورت گرفتهاست که در بخش مربوط به مرور ادبیات شرح داده خواهد شد. همچنین با توجه به حجم انبوه دادههای حوادث ناشی از کار که در مراکز صندوق تامین اجتماعی و ادارهی کار و امور اجتماعی جمعآوری شدهاند و محدودیتهای روشهای آماری در تحلیل دادهها و بلاخص در مدیریت ریسک حوادث، در سالهای اخیر دادهکاوی موردتوجه بسیاری قرار گرفته است. بنابراین ارائه مدلی جدید که با استفاده از تکنیکهای دادهکاوی بتوان از آن در ارزیابی ریسک حوادث ناشی از کار استفاده نمود، نه تنها در تصمیمگیری صحیح مدیران موثر خواهد بود، بلکه موجب بهبود ایمنی کار نیز خواهد شد. این پایاننامه، طراحی یک مدل جدید، با استفاده از پایگاهدادههای وزارت کار و امور اجتماعی را به عنوان نمونه دنبال میکند. مدلهای گوناگونی که تاکنون برای ارزیابی ریسک حوادث ناشی از کار چه به صورت کیفی یا کمی ارائه شدهاست با محدودیتها و مشکلات زیادی برای ارائه در سازمانها مواجه بودهاست. لذا ارائه مدلی جدید که بتواند به محققان و افراد مسئول در بررسی حوادث ناشی از کار و دریافتن روشهای ناشناخته کمک کند، میتواند بسیار مورد توجه و مفید واقع شود. 3-1- جنبه جدید بودن و نوآوری تحقیق: نوآوری این پروژه بردو جنبه مرور ادبیات و نحوه ارائه مطلب استوار است. بهعبارتی مطالب درج شده در این تحقیق به صورت یکپارچه، در هیچ منبعی یافت نمیشود و آنچه در این تحقیق گردآوری شدهاست به صورت مجزا از دو رشتهی نظام مدیریت ایمنی و بهداشت کار(HSE) و دادهکاوی اخذ شده است. به عبارتی دیگر در این تحقیق تلاش شده است تا روشی نوین در بازنگری روشهای کنترل، ارزیابی و مدیریت ریسک جهت پیشگیری از وقوع حوادث و بهبود ایمنی و سلامت کار ارائه شود. موضوع و دادههای استفاده شده در این تحقیق منحصر به فرد میباشد به نحوی که استفاده از دادهکاوی در حوادث ناشی از کار و مدیریت ریسک به روشی که در این تحقیق انجام شده تاکنون مشاهده نشده است. ارزیابی ریسک در هر کارگاهی منحصربه فرد میباشد. کارگاهها نیاز دارند که علاوه بر ارزیابی فعالیتها و فرآیندهایشان، درخصوص وضعیت ریسک حوادث ناشی از کار واحد تولیدی خود نیز ارزیابی قابل قبولی داشته باشند. البته استفاده از این روشها، بستگی به نوع فعالیت در هر صنعت دارد. در این تحقیق سعی شده است تا روشی نوین، برای مدیریت و ارزیابی ریسک ارائه شود به طوریکه بتوان از آن در هر صنعت و یا کارگاهی استفاده نمود تا با دقت بالایی نقاط بحرانی مورد شناسایی قرار گیرد. 4-1- قلمرو تحقیق(زمانی، مکانی، موضوعی): 1-4-1- قلمرو زمانی تحقیق: با توجه به اطلاعات قابل دسترس، دادههای حوادث ناشی از کار، مرتبط با سالهای 1371 تا 1389 هستند که در کارگاههای مختلف رخ دادهاند. این دادهها از سال 1385 که سیستم ثبت حوادث طراحی شده است، توسط بازرسین ادارهکار و امور اجتماعی استان قم جمعآوری شدهاند. این دوره زمانی، به عنوان قلمرو زمانی تحقیق درنظر گرفته شدهاست. 2-4-1- قلمرو مکانی تحقیق: این دادهها مربوط به بخش حوادث ناشی از کار، وزارت کار و امور اجتماعی میباشند که از واحد ادارهکار استان قم دریافت شدهاست. 3-4-1- قلمرو موضوعی تحقیق: از نظر موضوعی، تحقیق حاضر در حوزههای بهداشت و ایمنیکار(HSE)، مدیریت HSE، مدیریت ریسک، دادهکاوی و به طوراخص، در حوزه پیشگیری از وقوع حوادث قرار میگیرد. 5-1- ساختار پایاننامه: در فصلاول به بیان اهداف، کلیات تحقیق و همچنین ضرورت انجام تحقیق میپردازیم. در فصلدوم، مبانی نظری تحقیق بیان میشود که شامل روشهای ارزیابی ریسک، چارچوب مدل ارائه شده و همچنین مفاهیم و متغیرهای مهم است. در فصل سوم، ادبیات موضوعی تحقیق دربارهی حوادث ناشی از کار و مدیریت ریسک حوادث، بررسی میشوند. در فصلچهارم، روش تحقیق و چارچوب مدل ارائه شده به طور کامل شرح داده میشود و در انتها یک کاربرد عملی از مدل بیان میشود. در فصلپنجم، یک سری گزارشهای آماری، براساس حوادثی که در کارگاههای استانقم به وقوع پیوسته است، داده میشود و در انتها نتایج ارزیابی مدل و همچنین محدودیتها و پیشنهادها برای تحقیقات آتی مطرح خواهند شد. روش تحقیق 1-3- مقدمه: مرورادبیات و بررسی فعالیتهای انجام شده، در زمینههای بررسی حوادث، تحلیل و ارزیابی ریسک ناشی از حوادث، مدیریت و کنترل ریسک حوادث، نشان میدهد که از سال2006 به بعد رویکردی فزاینده به سمت استفاده از تکنیکهای دادهکاوی به وجود آمده است. تحلیل کلاستر و تئوری بایسان به شکلی گسترده در مطالعات این دوره مورد توجه قرار گرفتهاست. اما خلاء استفاده از تکنیکهای کاوشدادهها و بهکارگیری آن برای تحلیل ریسک و بررسی حادثه به شدت محسوس است و در این زمینه مطالعه محسوسی دیده نشدهاست. در نتیجه در این پژوهش سعی شده است تا با نگرشی جدید، ریسک حوادث مورد بررسی قرار گیرد. 2-3- مفاهیم مورد نیاز 1-2-3- الگوریتمK-means : این الگوریتم، پارامتر k را به عنوان ورودی گرفته و مجموعهی nشی را به kخوشه افراز میکند. به طوریکه سطح شباهت داخلی خوشهها بالا بوده و سطح شباهت اشیاء بیرون خوشهها پایین باشد. شباهت هر خوشه نسبت به متوسط اشیای آن خوشه سنجیده شده که این متوسط، مرکز خوشه نامیده میشود. 2-2-3- الگوریتم C5.0: از این الگوریتم برای ساختن درخت تصمیم و یا مجموعه قوانین استفاده میشود. نمونه دادهها را براساس خصیصههایی که بیشترین سود اطلاعاتی را فراهم میکنند، تقسیم میکند. هر زیر نمونه با اولین تقسیم تعیین میشود و سپس دوباره تقسیم میشود. این فرآیند تا هنگامی که زیر نمونهها نتوانند بیشتر تقسیم شوند تکرار خواهد شد. در انتها پایینترین سطح تقسیم، دوباره بررسی میشود و نودهایی که در ارزش مدل تاثیر چندانی ندارند، خارج و یا هرس میشوند. این الگوریتم تنها میتواند متغیرهای هدف از نوع دستهای را پیشبینی کند و در مهار دادههای گمشده بسیار تواناست. برای یادگیری نیاز به زمان زیادی ندارد و همچنین فهم مدل ساخته شده نسبت به دیگر مدلها آسانتر است. الگوریتم C5 نسبت به C4.5، در ساخت مدل سریعتر، در مصرف حافظه کاراتر و درخت ساخته شده حافظهی کمتری را اشغال میکند. 3-2-3- الگوریتم CHAID: این الگوریتم، یک روش ردهبندی برای ساختن درخت تصمیم است و با استفاده از آزمونهای مهم آماری به عنوان معیار، ارزش بالقوه تمام خصیصههای پیشگو را محاسبه میکند. با توجه به متغیر هدف، مقادیری که از نظر آماری همگن(مشابه) هستند را با هم ادغام میکند و بقیه مقادیر که ناهمگن(نامشابه) هستند را نگه میدارد. سپس بهترین پیشگو را برای ساختن اولین درخت تصمیم، انتخاب میکند. این فرآیند به شکل متناوب تا رشد کامل درخت ادامه مییابد. الگوریتم CHAID، یک روش درخت دودویی نیست در واقع میتواند در هر سطح خاصی از درخت، چند شاخه تولید کند. بنابراین این الگوریتم بیشتر به ساختن درختهای پهنتر تمایل دارد. خصیصههای هدف یا پیشگو، میتوانند بازهای و یا دستهای باشند. این درخت میتواند با هر نوعی از متغیرها کار کند و متغیرهای فراوانی و وزنی را میپذیرد اما خصیصههای ترتیبی، باید به شکل عددی و نه رشتهای ذخیره شوند. الگوریتم CHAID، مقادیر گمشده را با انتساب همهی آنها به یک دسته تکی معتبر مهار میکند. 4-2-3- الگوریتم C&RT: این الگوریتم یکی دیگر از روشهای ایجاد درخت تصمیم است و به وسیلهی بریمن و همکارانش در سال 1984 ایجاد شده است. هدف این الگوریتم، ایجاد درختی است که بتوان به وسیلهی آن متغیر وابسته یا همان برچسب دسته را برای یک نمونه جدید پیشبینی نمود. روش C&RT، شاخههای خود را به صورت دوتایی و تنها براساس یک فیلد(متغیر مستقل) انشعاب میزند. درواقع هر گروه غیر برگ در این الگوریتم، به دو گروه دیگر تفکیک میشود. در مرحلهی بعد دو شاخه داریم که هرکدام دارای یک سری رکورد است و برای هریک از آنها دوباره یک فیلد را طوری انتخاب میکنیم که بتوان بهترین شاخههای جدید را با حداقل گوناگونی ایجاد کرد. این مراحل را آنقدر ادامه میدهیم تا در هر زیر شاخه به گرهای برسیم که ایجاد شاخه جدید، گوناگونی را تغییر ندهد. به این گره نهایی برگ گفته میشود. 5-2-3- الگوریتم QUEST: این الگوریتم یک درخت دودویی رشد کننده جدید است. یکی از انگیزههای مهم از توسعهی این الگوریتم، کاهش زمان پردازش مورد نیاز برای تحلیل درختهای بزرگ مانند C&RT با متغیرها و نمونههای زیاد است. الگوریتم QUEST، برای ارزیابی متغیرهای پیشگو در هرگره از درخت، از دنبالهای از قوانین استفاده میکند. برخلاف C&RT، همه تقسیمها بررسی نمیشوند و هنگام ارزیابی برای انتخاب یک پیشگو، ترکیب دستهها آزمایش نمیشوند و این سرعت تحلیل را بالا میبرد. خصیصهها میتوانند از بازههای عددی باشند اما خصیصه هدف باید از نوع دستهای باشد. خصیصههای ترتیبی باید به شکل عددی و نه رشتهای ذخیره شوند. همهی سودمندیهای الگوریتم C&RT را دارد اما همانند آن درخت میتواند سنگین باشد. میتوانیم از هرس خودکار، برای کاهش اندازه درخت و از تقسیم جانشین، برای مهار مقادیر گمشده استفاده کنیم. 6-2-3- معیارهای ارزیابی ردهبند: رایج ترین معیار برای ارزیابی ردهبند، معیار صحت میباشد که در اغلب مقالات مورد استفاده قرار میگیرد. یک روش برای نمایش کارایی ردهبند، استفاده از ماتریس اغتشاش است. این ماتریس، شامل اطلاعاتی در مورد ردهی واقعی و ردهی پیشبینی شده توسط سیستم ردهبندی است(Cheng & Chen, 2009). جدول 1-3، ساختار ماتریس اغتشاش را برای مسائل دو ردهای نشان میدهد. معیار صحت مطابق با فرمول(1) محاسبه میشود. این معیار، روشی ساده برای توصیف کارایی الگوریتم، روی یک مجموعهی داده را فراهم میکند. ولی در بعضی از مواقع، این معیار میتواند فریبنده باشد. سادهترین موقعیت، زمانی است که مثلا 5 درصد دادهها متعلق به یک رده و 95 درصد متعلق به ردهی دیگر باشند. در این صورت حتی اگر ردهبند، هیچیک از دادهها را به ردهی اول اختصاص نداده و تمام دادهها را متعلق به رده دوم معرفی کند، باز هم صحت الگوریتم 95 درصد خواهد بود. بنابراین در صورتی که دادهها نامتوازن باشند، صحت، معیار مناسبی برای ارزیابی کارایی الگوریتم نخواهد بود. در این تحقیق از معیارهایی دیگری همچون بازخوانی، دقت و معیارF نیز برای اعتبارسنجی ردهبند استفاده میشود(فرمولهای 2 تا 4). معیار دقت در حقیقت بیان میکند که از بین تمام نمونههایی که مثبت تشخیص داده شدهاند، چه تعداد از آنها به درستی تشخیص داده شدهاند. معیار بازخوانی بدین معناست که از بین تمام نمونههای متعلق به ردهی مثبت، چه تعداد از آنها به درستی تشخیص داده شدهاند. در صورتیکه بخواهیم فقط بر معیار بازخوانی تکیه کنیم، دچار ابهام خواهیم شد چرا که این معیار هیچ اطلاعاتی در مورد تعداد نمونههایی که اشتباها به عنوان نمونهی مثبت معرفی شدهاند ارائه نمیدهد.به طور مشابه، معیار دقت نیز مشخص نمیکند که از بین تمام نمونههای مثبت، چه تعداد از آنها به درستی ردهبندی نشدهاند. معیارF، دو معیار بازخوانی و دقت را با هم ترکیب کرده و معیاری جدید برای ارزیابی کارایی ردهبند، معرفی میکند. این معیار، در حقیقت میانگین موزون دو معیار بازخوانی و دقت میباشد. بنابراین معیار F، دید بهتری از کارایی ردهبند به ما میدهد. این معیار، مقادیری در بازهی [0و1] تولید میکند به طوری که مقدار بیشتر، به معنای کیفیت بهتر ردهبند میباشد. جدول 1-3: ماتریس اغتشاش برای مسائل دو ردهای کلاس پیشبینی شده کلاس= خیر کلاس = بلهکلاس واقعیb(FN)a(TP) بله = کلاس d(TN)c(FP)خیر = کلاس a: TP(true positive) b: FN(false negative) c: FP(false positive) d: TN(true negative) Accuracy = a+da+b+c+d (1) Precision = aa+c (2) Recall = aa+b (3) F-measure = 2a2a+b+c (4) 7-2-3- مدل RFM: مدل RFM كه توسط هيوز درسال 1994 ارائه شدهاست، چندين دهه است كه در بازاريابي مستقيم مورد استفاده قرار گرفته است. اين مدل رفتار مشتريان را شناسايي كرده و ويژگيهاي رفتاري مشتريان را با سه متغير ارائه ميدهد(McCarty & Hastak, 2007). تازگي خريد: فاصلهي زماني بين آخرين خريد مشتري و زمان تحليل اطلاعات مشتري. فراواني خريد: تعداد تراكنشهاي مشتري در يك دورهي خاص. ارزش پولي خريد: مقدار خريد مشتري در يك دورهي خاص. مدل RFM در زمينههاي مختلف، به وسيلهي افراد مختلفي ميتواند مورد استفاده قرار گيرد. بنابراين RFM ميتواند به معناي، چيزهاي مختلف براي افراد مختلف باشد. اساسا کاربرد مدل RFM، برش هر متغیر در 5 سطح است، بدین صورت که 20% از مشترياني كه بيشترين خريد را از شركت داشتهاند به عدد 5 نسبت داده ميشوند. 20% بعدي به عدد 4 و... . در نهایت پايگاهداده به 125 قسمت مساوي براساس تازگي، تكرار و ارزش خريد تقسيم ميشود. مشترياني كه بيشترين امتيازها را داشته باشند سودآورترين هستند. 3-3- روند انجام کار: در این بخش روند تحقیق، مورد بررسی قرار میگیرد. مراحل انجام کار در شکل1-3 نشان داده شده است. پیشپردازش دادههااجرای مدل DFSRMدرک داده بررسی حالتهای مختلف و استخراج قوانین یک کاربرد عملی از مدلشناسایی حادثهپذیرترین کارگاهها شکل 1-3: روند انجام کار 1-3-3- درک داده: در این پژوهش برای ارائه مدل پیشنهادی، از دادههای وزارت کار و امور اجتماعی استفاده شده است که مربوط به بخش حوادث ناشی از کار استان قم میباشند. سیستم نرمافزاری در سال 1385 طراحی شده و در اختیار ادارههای کار استانها قرار گرفته است. اطلاعات حوادث کار استان قم، به صورت روزانه توسط بازرسین وارد سیستم میشوند. بازرسین با رمزعبور و نامکاربری خود میتوانند اطلاعات مربوط به کارگاهها، بازرسیهای ادواری، آییننامهها، گزارشهای حوادث و کمیته حفاظت فنی و بهداشت و... وارد نمایند. پایگاهداده اصلی شامل 51 جدول و از نوع SQL Server میباشد. طی بررسیهای انجام شده، فقط سه جدول کارگاه، حادثه و حادثهدیده در این مدل استفاده شدهاند. این جداول به ترتیب دارای 6383، 869 و 848 رکورد هستند. جدول کارگاه، اطلاعات جامعی از وضعیت کارگاهها مانند فعالیتاصلی کارگاه، تعداد کارگران، تعداد شیفتکاری، وضع ساعتکار، وضع رفاهی، وضع حقوقی و وضعیت ایمنی کارگاهها که شامل کمیتهحفاظت، مسئول ایمنی و بیمه مدنی میباشد را در اختیار دارد. جدول حادثه، دربردارنده اطلاعاتی مانند تاریخ حادثه، ساعت حادثه، محل وقوع حادثه، عامل وقوع حادثه، علت وقوع حادثه و تعداد حادثهدیده است و جدول حادثهدیده شامل اطلاعات دموگرافی فرد حادثهدیده مانند سن، جنسیت، ملیت، وضعیت تاهل، وضع پزشکی، تعداد روز استراحت، مزد فرد حادثهدیده، آموزش، ساعت آموزش، محل آسیب و نتیجه حادثه و... است. 2-3-3- پیشپردازش دادهها: پیشپردازش یا آمادهسازی دادهها، گام مهم و حیاتی در فرایند دادهکاوی است که تاثیر بسیار مهمی بر موفقیت پروژههای دادهکاوی دارد. هدف از گام پیشپردازش دادهها، انجام فرایند پاکسازی، برای مقادیر ازدست رفته و دادههای نویزی، کاهش ابعاد و تغییر و تبدیل دادهها در صورت لزوم است. کاربران عمومي سيستم، معمولا دادهها را با خطا و يا با مقادير غيرعادي وارد ميکنند؛ حتي ممکن است دادهها در يک فرمت غير معمول ذخيره شوند؛ بنابراين دادهها بايد قبل از کاوش، آماده شوند. دادهها ممکن است به هر دليلي نياز به تحليل توسط تکنيکهاي دادهکاوي داشته باشند، از جملهی این دادهها، میتوان به موارد زیر اشاره کرد: ناقص: فاقد ويژگي مقادير، يا ويژگيهاي مشخص و يا فقط از تودهاي داده تشکيل شدهاست. مغشوش: شامل خطاها و يا مقاديري است که از آنچه مورد انتظار است منحرف شدهاند. ناسازگار: دارای تناقص در کدها یا نامها هستند. دادههای ناقص میتواند ناشی از مشکلات انسانی، نرمافزاری و یا سختافزاری به وجود آید و یا بین زمان جمعآوری داده و تحلیل آن تفاوت قابل ملاحظهای وجود داشته و یا مقدار داده هنگام جمعآوری قابل قبول نبوده است. دادههای مغشوش میتواند ناشی از ایراد ابزار جمعآوری داده و یا خطای انسانی و یا کامپیوتر هنگام ورود داده و یا خطا در انتقال دادهها باشد. اما دادههای ناسازگار اغلب نتیجه منابع مختلف داده و یا مسائل و اختلافات بخشهای وظیفهای است(غضنفری, علیزاده, & تیمورپور, 1387). 1-2-3-3- رفع آنومالی اشتباه بازرس: نرمافزار ثبت حوادث به گونهای طراحی شدهاست که هر بازرس میتواند با نامکاربری و رمزعبور خود وارد سیستم شود و اطلاعات مورد نظر خود را وارد سازد و یا دادههای قبلی را ویرایش کند. بازرسین میتوانند به تمامی اطلاعاتی که توسط خود و یا توسط بازرسین دیگر وارد سیستم میشوند دسترسی داشته باشند که این امر منجر به بروز مشکلاتی از جمله تغییر و یا حتی حذف کامل اطلاعات وارد شده توسط بازرس دیگر میشود. 2-2-3-3- داده غلط: اطلاعات مربوط به جداول حادثه و یا فرد حادثهدیده در بعضی از موارد به اشتباه چندین بار توسط بازرسین وارد شده است. با بررسی دقیق جداول حادثه و حادثهدیده، کد کارگاههایی که چنین وضعیتی داشتند شناسایی شدهاند و رکوردهای مورد نظر، از این جداول حذف شدهاند(جدول2-3). جدول2-3: رفع اشتباه بازرسین کد کارگاهکد حادثه غلطجدول(حذف شدند)74001حادثه و حادثهدیده321001حادثه و حادثهدیده388001حادثه619002حادثه717002حادثه916001حادثه1146001حادثه و حادثهدیده3803001 و 003حادثه003حادثهدیده3231001حادثه و حادثهدیده 3-2-3-3- داده مغشوش: سن فرد حادثهدیده در سه رکورد به صورت نادرست؛ 0 ، 2 و 236 ثبت شده بودند که خارج از انتظار بوده و حذف شدهاند. 4-2-3-3- داده از دست رفته: فیلد تعداد افراد حادثهدیده در جدول حادثه، در چندین رکورد به صورت نادرست پر شده بود که با کمک فیلدهای دیگر و با بررسیهای دقیقتر اصلاح شد. در جدول3-3، کد کارگاههایی که این مشکل را داشتند، مشخص شدهاند. جدول3-3: اصلاح فیلد تعداد افراد حادثهدیده کد کارگاهتعداد حادثهدیدهمقدار اصلاح شده50، 154،269، 386، 387، 388، 389، 422،440، 441، 442011059، 2133، 2610، 2885، 288601578023534، 4399، 4426، 477221 3-3-3- مدل جدید DFSRM: این مدل براساس مدل RFM پیشنهاد شده است. در ابتدا فیلدهای مورد نیاز از سه جدول کارگاه، حادثه و حادثهدیده انتخاب میشوند؛ رکوردهای دادهها مربوط به سالهای 1371 تا 1389 هستند، ابتدا نقاط پرریسک، شناسایی شده و تحلیل میشوند. آنگاه در مرحلهی بعد یک نمونه از کاربرد مدل نشان داده خواهد شد. 1-3-3-3- چارچوب مدل DFSRM: خوشهبندی دادهها براساس شاخصهای تعیین شده و پیدا کردن K بهینهاستفاده از ضرایب ارزیابی حوادث به عنوان شاخصهای ارزیابی ریسک تعیین سطح ریسک برای هر خوشه و امتیازدهی به خوشههابررسی حالتهای مختلف و استفاده از مدلهای درخت تصمیمگیری تحلیل و ارزیابی عملکرد مدل تحلیل قوانین بدست آمده شکل2-3: چارچوب مدل DFSRM 2-3-3-3- مزایای اصلی مدل: ساده و قابل فهم بودن: مدل DFSRM، نسبت به دیگر روشهای ارزیابی ریسک، ساده و قابل فهم است. به طور کلی استفاده از آمار برای ارزیابی ریسک حوادث، پیچیده، زمانبر و دارای محدودیتهای زیادی است. گستردگی استفاده: از این مدل، تقریبا میتوان در تمامی پایگاهدادههای حوادث که متغیرهای مورد نیاز را داشته باشند، استفاده نمود. همچنین برای شناسایی نقاط بحرانی در هر صنفی قابل استفاده است. ریشهیابی علل و عوامل حوادث: با استفاده از این مدل بهراحتی میتوانیم در هرسال، کارگاهها با سطح ریسک خیلی بالا را شناسایی کرده و علل و عواملی که موجب این وضع شدهاند را ریشهیابی نمود. بررسی نتایج: تحلیل نتایج بدست آمده از این مدل، به بازرسین کار کمک خواهدکرد تا نقاط پرریسک را شناسایی کرده و آنها را زیر نظر داشته باشند، تا از بروز حوادث ناگوار جلوگیری نمایند. هوشمندکردن بازرسی ادواری: پس از آنکه سطح ریسک کارگاهها در هر سال محاسبه شد، میتوان وضعیت آنها را در سالهای بعد نیز دنبال نمود. زیرا تغییرات به وجود آمده میتواند به بازرسین کمک کند تا در بازرسیهای ادواری خود به صورت هوشمندانهتری عمل کنند. اولویت بازرسی: فیلد اولویت بازرسی در جدول حادثهدیده، که کارگاهها با سطح ریسک بالا را نشان میدهد و فیلد بازرسی مجدد که نیاز یک کارگاه به بازرسی بعدی را مشخص میکند، براساس تجربهی بازرسین وزارت کار پر میشوند. با استفاده از مدل DFSRM و تشخیص نقاط بحرانی، این فیلدها میتوانند به صورت دقیقتری مشخص شوند. 3-3-3-3- مفهوم هریک از حروف مدل DFSRM D= (Different-TwoDate) = اختلاف دو تاریخ. F = (Frequency-Rate) = ضریب تکرار حادثه. S= (Severity-Rate) = ضریب شدت حادثه. R= (Risk-Rate) = ضریب ریسک حادثه. M = (Monetry) = هزینه 4-3-3-3- متغیرهای اصلی مدل: اختلاف دو تاریخ: فاصله زمانی بین آخرین تاریخ وقوع حادثه و یک حادثه ماقبل آن. ضریب تکرار حادثه: يا ضریب تعداد حادثه، يا ضریب فراواني حادثه، عبارت است از تعداد حوادث و تصادفاتي که در مدت معيني(معمولا يک سال) منجر به ضايعات انساني ميشوند. ضریب وقوع حادثه: اين ضريب بيانگر تعداد موارد مرگ و ميرهاي شغلي، آسيبهاي حرفهاي و بيماريهاي شغلي است که در يک جامعه صنعتي صد نفري در طول مدت يکسال گزارش ميشود. ضریب شدت حادثه: عبارت است از شمار روزهای از دست رفته برای هر حادثه در یک مدت معین(معمولا یک سال)، که برای حوادث منجر به مرگ یا قطع عضو و یا نقص عضو از تعداد روزهای از دست رفته معادل استفاده خواهد شد. ضریب ریسک حادثه: عبارت است از شدت تاثیرات مخرب یک حادثه به همراه احتمال رخداد آن، که میزان ریسک محتمل یک حادثه را مشخص میکند. هزینه تعداد روزهای از دست رفته: عبارت است از هزینههای مستقیم و غیرمستقیمی که به ازای هر کارگری که بر اثر حادثه ناشی از کار، فوت میشود به کارفرما و محیط کار و یا جامعه و در نهایت به دولت تحمیل خواهد شد. این میزان براساس تخمین دولت، در هر صنف و یا هرکارگاهی، به ازای هرکارگر فوتی 4 میلیارد تومان برآورد شده است. توجه: آمار منتشر شده از سوی وزارت کار نشان میدهد در اثر حوادث شغلی، نزدیک به یک میلیون روز کاری به منظور درمان کارگران به هدر رفته و بالغ بر 62 هزار روز از کار مفید کارگران به علت بستری شدن تضییع شده است. براساس تحقیقات انجام شده در وزارت کار و آمارهای غیررسمی، فوت هر کارگر 7 هزار و 200 روز کاری هزینه دارد که این هزینه برای هر کارگر ماهر و آموزش دیده حدود 4 میلیارد تومان است که شامل هزینه تربیت و آموزش کارگر، هزینه کمک به خانواده کارگر متوفی و... میشود(اخوان بهبهانی, 1390). توجه : هرچه فاصلهی زمانی بین دو تاریخ کمتر باشد، حوادث در فاصله زمانی کوتاهتری رخ دادهاند و آن کارگاه سطح ریسک بالاتری دارد. 4-3-3- شناسایی حادثهپذیرترین کارگاهها: دادههایی که در این تحقیق مورد استفاده قرار گرفتهاند، مربوط به حوادث ناشی از کار استان قم میباشند. این نرمافزار در سال 1385 طراحی شده است و در اختیار مراکز استانها قرار گرفته است. بازرسین استان قم از سال 1385 شروع به واردکردن اطلاعات مرتبط با حوادث ناشی از کار نمودهاند. این اطلاعات میتوانند مربوط به سالهای قبل از 1385 نیز باشند. براساس نظر خبره، هر فرد کارگر میتواند تمامی حوادثی که در طی دوره کاریش اتفاق افتاده است گزارش دهد. درنتیجه دادههایی که در این تحقیق بررسی شدهاند، مرتبط با حوادثی هستند که طی سالهای 1371 تا 1389 اتفاق افتادهاند. در ادامه مدل DFSRM برای ارزیابی ریسک این گونه حوادث، به کار گرفته خواهد شد. 1-4-3-3- محاسبه متغیرهای مدل DFSRM براساس نظر خبره، صنایع و کارگاههای موجود، با توجه به نوع فعالیت اصلیشان به دو دسته مشاغل سخت و زیانآور(X) و عادی(Y) تقسیم میشوند(جداول4-3 و 5-3). سپس این ضرایب به صورت مجزا برای هر دو دسته محاسبه خواهد شد. جدول4-3: مشاغل سخت و زیانآور و عادی کدفعالیت اصلینظر خبره1کشاورزي و شکار و جنگلداريسخت و زیان آور2ماهيگيريسخت و زیان آور3استخراج معدنسخت و زیان آور4صنعت – توليدسخت و زیان آور و عادی5تامين برق و گاز و آبسخت و زیان آور و عادی6ساختمانسخت و زیان آور7فروش و تعميرات كالاهاي شخصي و خانگي و وسايل نقليه موتوريعادی8هتل و رستورانعادی9حمل و نقل و انبارداري و ارتباطاتعادی10واسطه گريهاي ماليعادی11مستغلات اجاره و فعاليتهاي كسب و كارعادی12اداره امور عمومي و دفاع و تامين اجتماعي اجباريعادی13آموزشعادی14بهداشت و مددکاري اجتماعيعادی15ساير فعاليتهاي خدمات عمومي و اجتماعي و شخصيعادی16خانوارهاي معمولي داراي مستخدمعادی17سازمانها و هياتهاي برون مرزيعادی18دفاتر و ادارات مرکزيعادی جدول5-3: تفکیک فعالیتهای بخش صنعت و تولید و برق، به دودسته سخت و زیانآور و عادی کدفعالیت اصلیکدفعالیتX4صنعت و تولید15صنايع موادغذايي و آشاميدنيخیر17توليد منسوجاتبلی18توليد پوشاك- عملآوردن و رنگ كردن پوست خزدارخیر19دباغي و عملآوردن چرم و ساخت كيف و تولید کفشبلی20توليد چوب ومحصولات چوبي وچوب پنبه غيرازمبلمانبلی21توليد كاغذ و محصولات كاغذيبلی22انتشار و چاپ و تكثير رسانههاي ضبط شدهخیر24صنايع توليد مواد و محصولات شيميائيبلی25توليد محصولات لاستيكي و پلاستيكيبلی26توليد سايرمحصولات كاني غيرفلزيبلی27توليد فلزات اساسيبلی28توليد محصولات فلزي فابريكي بجزماشين آلات و تجهيزاتبلی29توليد ماشين آلات و تجهيزات طبقهبندي نشده خیر31توليد ماشين آلات مولد و انتقال برق دستگاههاي برقيخیر34توليد وسايل نقليه موتوري و تريلر و نيمتريلربلی35توليد ساير وسايل حمل و نقلبلی36توليد مبلمان و مصنوعات طبقهبندي نشده در جاي ديگرخیر37بازيافتبلی5برق40تامين برق و گاز و بخار آب گرمخیر41جمعآوري و تصفيه و توزيع آببلی مجموع ساعت مفید کارگران(جدول6-3): مشاغل سخت و زیان آور(X): مجموع ساعت کار سودمند کارگران در طی یک سال= تعداد کارگران * 1680 مشاغل عادی(Y): مجموع ساعت کار سودمند کارگران در طی یک سال = تعداد کارگران * 2112 جدول6-3: ساعات کاری، مشاغل سخت و زیانآور و عادی مشاغل سخت و زیان آورعادیساعت کاریروز6 ساعتروز8 ساعتهفته36 ساعتهفته34 ساعتماه140 ساعتماه140 ساعتسال1680 ساعتسال2112 ساعت فاصله زمانی بین دو رخداد حادثه: D.T = فاصلهی زمانی بین آخرین تاریخ وقوع حادثه و یک تاریخ ماقبل آن ضریب تکرارحادثه: F.R = 106 * شمار حوادث در يک مدت معين /مجموع ساعت کار سودمند کارگران درهمان مدت ضریب وقوع حادثه: I.R = 200000 * شمار حوادث در يک مدت معين /مجموع ساعت کار سودمند کارگران در همان مدت ضریب شدت حادثه: S.R = 1000 * شمار روزهاي از دست رفته / مجموع ساعت کار سودمند کارگران در همان مدت ضریب ریسک: R.R = احتمال وقوع یک رخداد * شدت پیامد = ضریب شدت حادثه * ضریب تکرار حادثه هزینه: M =تعداد کارگرهای فوت شده در یک کارگاه * 4,000,000,000 توجه: برای محاسبهی فاصلهی زمانی بین دو رخداد حادثه، یک سال 365 روز و تمامی ماههای سال 30 روزه در نظر گرفته شدهاند. توجه: در این مدل برای محاسبه فراوانی حوادث در یک کارگاه، به جای ضریب تکرار حادثه از ضریب وقوع حادثه استفاده شده است. هر دو ضریب برای محاسبهی تکرار حوادث به کار میروند اما ضریب تکرار حادثه، در کارگاههای بزرگ و یا برای محاسبهی تکرار حوادث در صنایع کاربرد دارد. استفاده از ضریب وقوع حادثه به جای ضریب تکرار حادثه در کارگاههای کوچک موجب میشود اعداد بدست آمده به واقعیت نزدیکتر باشند(طبق نظر خبره). توجه: شمار روزهای از دست رفته، معادل است با مجموع مقدار فیلد تعداد روز استراحت، از جدول حادثهدیده و مقدار تعداد روز استراحت معادل(Z)، که برای حوادث منجر به فوت و قطع عضو و نقص عضو محاسبه میشوند(جدول 7-3). توجه: حوادث منجر به فوت معادل است با 7500 روز از دست رفته. توجه: در صورتیکه قسمتهایی از بدن دچار مصدومیت شدهاند و در جدول 8-3، مشخص نشده باشند و یا نتوانیم تشخیص دهیم که کدام قسمت از بدن دقیقا دچار نقص و یا قطع عضو شدهاند، تعداد روزهای از دست رفته معادل را 0 در نظر میگیریم. جدول7-3: جدول استاندارد برای محاسبه تعداد روزهای از دست رفته معادل ZعارضهZعارضه2800شصت و چهار انگشت1800كوري يك چشم3000كف دست از ناحيه مچ6000كوري دو چشم3600بازو از ناحيه آرنج (بين مچ و آرنج)150قطع يك بند انگشت3600بازو از ناحيه شانه (بين آرنج و شانه)700شصت كامل150شصت پا750دو انگشت كامل300كف پا از ناحيه مچ1200شصت و يك انگشت2400ساق از ناحيه زانو (بين مچ و زانو)1500شصت و دو انگشت3000ران از ناحيه لگن (بين زانو و لگن)1200سه انگشت كامل6000از كار افتادگي دائم1800چهار انگشت كامل توجه: در جداول وزارتکار، ریز جزئیات مربوط به محل آسیب، فرد حادثهدیده ذکر نشدهاست به همین دلیل بدترین حالت برای محاسبه تعداد روزهای از دست رفته، در نظر گرفته میشوند(جدول8-3). توجه: فیلد محل آسیب فرد حادثهدیده در جدول حادثهدیده درحوادث منجر به قطع و یا نقصعضو، در بعضی از رکوردها توسط بازرسین وزارت کار پر نشدهاند؛ درنتیجه برای حفظ دقت و صحت مدل ارائه شده، تعداد روزهای از دست رفته معادل، برای این گونه موارد 0 در نظر گرفته میشوند. جدول8-3: محل آسیب فرد حادثهدیده تعداد روزهای از دست رفته محل آسیب فرد حادثهدیده2800دستها - دست چپ - انگشتان دست 6400دستها - ساعد - دست چپ - انگشتان دست 4500دستها - دست راست 6000سر - چشم راست - چشم چپ 2400پاها - زانو - پاي چپ 1800سر - چشم چپ ...... توجه: یک فیلد سختیحادثه برای محاسبه تعداد روزهای از دست رفته معادل، به خروجی سه جدول کارگاه، حادثه و حادثهدیده اضافه شده است(جدول9-3). جدول9-3: سختی حادثه کدسختی حادثه0سایر1نقص عضو2قطع عضو3مرگ توجه: انجمن امریکایی تعیین استانداردها، شدت حادثه را براساس هریک میلیون ساعت کار محاسبه میکند، اما با توجه به تصویب ششمین کنفرانس بین المللی آمارگران، صورت کسر ضریب شدت حادثه در 1000 ضرب میشود. بدین ترتیب شدت حادثه مورد قبول در کشورهای متحده آمریکا، 1000 برابر میزانی است که این کنفرانس تایید کرده است. 2-4-3-3- نرمالسازی: پس از محاسبه متغیرهای اصلی مدل DFSRM، فیلدهای DT، IR، SR،RR وM را با استفاده از فرمول min-max(فرمول5) برای ورود به مرحله بعد نرمالسازی میکنیم(Cheng & Chen, 2009). NV=(V-minxA)(maxA-minA) (5) دراین فرمولminA، بیانکننده کمترین مقدار فاصله زمانی بین دو رخداد حادثه و یا ضریب وقوع و یا ضریب شدت حادثه و یا ضریب ریسک و یا هزینه مالی تعداد روزهای از دست رفته معادل، میباشند وmaxA ، بیشترین مقدار این فیلدها است. پس از نرمالسازی، مقادیر DT، IR، SR،RR وM به بازه 0 تا 1 نگاشت شده وآماده برای ورود به مرحله بعد میشوند(جداول10-3 و 11-3). جدول10-3: مقادیر متغیرهای مدل DFSRM کد کارگاهDTIRSRRRM302.53200025682.49231.15077.62740000000004301.25317.54321.9840473970.91512.97111.87840000000009607.2842.18515.91809809.469000….…………… جدول11-3: نرمالسازی متغیرهای مدل DFSRM کدکارگاهNDTNIRNSRNRRNM300.021000250.0260.0210.00900.3334300.0110.00500470.1530.0080.00400.3339600.0610.001009800.080000….…………… 3-4-3-3- خوشهبندی: در این مرحله از 5 متغیر نرمال شده DT، IR، SR، RI و M، به عنوان معیارهایی برای خوشهبندی استفاده میشوند. در الگوریتم k-mean تعداد مناسب خوشهها، با استفاده از روش میانگین مربع خطاها (SSE) بدست میآید(فرمول6) (Cheng & Chen, 2009). SSE= i=1kx∈Cidist2(mi,x) (6) دراین فرمول k، برابر تعداد خوشهها، mi، مرکز خوشه وx ، رکورد متعلق به آن خوشه است. جدول 12-3، SSE هر خوشه را نمایش میدهد. براي يافتن بهترين تعداد خوشهها در يك بازهي 2 تا 11 با استفاده از فرمول(6)، نمودار1 بدست آمده است. براساس اين نمودار تعداد خوشه مناسب برابر 6 است(شکل 3-3). جدول12-3: مقادیر SSE در هرخوشه SSEشماره خوشه68.91050232259.08493024344.76452325439.56455996530.10922515633.80786462735.35486465834.57230038932.090721251022.2151143111 شکل3-3: نمودار SSE، برای نمایش K بهینه توجه: نمودار، از شماره 1 شروع میشود. درنتیجه مقدار بهینه برروی نمودار، عدد 5 یعنی K برابر 6 است. 4-4-3-3- تعیین سطح ریسک برای هر خوشه: پس از خوشهبندي برای تعیین میزان سطح ریسک هر کدام از خوشهها، از فرمول (7) استفاده میکنیم(Cheng & Chen, 2009): C1=(V11,V12,V13,V14,V15) (7) C2=(V21,V22,V23,V24,V25) … C6=(V61,V62,V63,V64,V65) D1=(V11-0)2+(V12-0)2+…+(V15 -0)2 D2=(V21-0)2+(V22-0)2+…+(V25-0)2 … D6=V61-02+V62-02+…+V65-02 در این فرمول Vij، ميانگين متغيرهاي NDT-NIR-NSR-NRI-NM، در هر خوشه است و Di ، نشاندهندهي فاصلهي مركز هر خوشه از نقطهي صفر ميباشد. پس از محاسبه Di ، نتایج حاصل به صورت نزولی مرتب میشوند. خوشهای که بیشترین مقدار را داشته باشد، برچسب پرریسکترین کارگاه متعلق به آن است و به همین ترتیب خوشههای بعدی برچسب زده میشوند. نتايج حاصل از پياده سازي الگوريتم k-means در جداول 13-3 و 14-3، نشان داده شدهاند. جدول13-3: مقادیر Di برای هر خوشه و تعیین سطح ریسک سطح ریسکDiNMNRINSRNIRNDTنام خوشهخيلي كم0.1357055640.0250.0010.0070.130.029خوشه 1زیاد0.5984889310.3330.1470.3150.3550.021خوشه 2شدید1.05256923810.0820.2330.20.083خوشه 3متوسط0.2368564970.0140.0020.0060.2360.013خوشه 4خیلی بالا0.89763188400.0170.0130.8970.026خوشه 5کم0.1401249440.0330.0020.010.0810.109خوشه 6 با توجه به جدول13-3، کارگاهها در 6 دسته مختلف قرار میگیرند. دستهها با سطح ریسک شدید، خیلیزیاد، زیاد، متوسط، کم و خیلیکم که به ترتیب در این دستهها، 2، 27، 21، 198، 78 و 182 کارگاه قرار گرفتهاند. جدول14-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند. خوشهسطح ریسکامتیازکد کارگاه1خيليكم12151، 2317، 2375، 2490، 2492، 2551، 2592، 2627، 2635.......2زیاد43014، 3229، 3280، 3426، 3617، 3704، 4057، 4399، 4459......3شدید6504، 37134متوسط33409، 3518، 3523، 3569، 3606، 3607، 3620، 3787، 3803....5خیلیزیاد5589، 787، 3204، 3403، 3458، 3510، 3554، 3597، 3623......6کم23، 25، 43، 47، 96، 98، 100، 149، 153، 161، 173، 184، 185...... 5-4-3-3- بررسی حالتهای مختلف: پس از اینکه سطح ریسک هر دسته مشخص شد، برای تجزیه و تحلیل نتایج بدست آمده و علل و عوامل قرار گرفتن هر کارگاه در دسته معین، از مدلهای درخت تصمیمگیری با رویکرد مبتنی بر قانون مانند C5.0، CHAID، C&RT، QUEST استفاده خواهیم کرد. این مدلها به ما کمک خواهند کرد تا بتوانیم قوانین مستدلی از وضعیت کارگاهها بدست آوریم. بدین منظور در ابتدا حالتهای مختلف بررسی میشوند و آنگاه به کمک مدلهای درخت تصمیمگیری برای هر حالت، قوانین معتبری استخراج میشوند. حالت اول: خوشهی 3 را که تنها دو کارگاه در آن قرار گرفته است کنار میگذاریم و به طورجداگانه تحلیل میکنیم. خوشههای 1 و 6 که سطح ریسک کم و خیلیکم دارند را ادغام میکنیم تا یک دسته 260 رکوردی بدست آید. خوشههای 3، 4 و 5 که سطح ریسک متوسط رو به بالا دارند را نیز ادغام کرده تا یک دسته 246 رکوردی بوجود آید. حالت دوم: خوشههای 2، 5 و3 که سطح ریسک بالا، خیلیبالا و شدید دارند را ادغام میکنیم تا یک دسته 50 رکوردی بدست آید و آن را در مقابل خوشهای با سطح ریسک کم با 78 رکورد در نظر میگیریم. حالت سوم: خوشهی 4 را که سطح ریسک متوسط دارد با 198 رکورد، در مقابل خوشهی 1 که در آن کارگاههایی با سطح ریسک خیلیکم قرار گرفتهاند و 182 رکورد دارد بررسی میکنیم. حالت اول: وضعیت کارگاهها با سطح ریسک کم و خیلی کم در مقابل کارگاهها با سطح ریسک متوسط رو به بالا(جدول15-3). جدول15-3: تقسیمبندی سطح ریسک در حالت اول سطح ریسکتعداددستهکم – خیلی کم2601متوسط – بالا – خیلی بالا2462 1-5-4-3-3- قوانین استخراج شده از مدلهای درخت تصمیمگیری(حالت اول): درخت تصمیمگیری QUEST: اگر تعداد کارگران یک کارگاه کمتر از 17 نفر باشد و یک شیفته یا دو شیفته و یا سه شیفته کار میکنند، در دستهی 1 قرار میگیرد. کارگاههای یک شیفته، دو شیفته و سه شیفته که مجوز کار ندارند در دستهی 2 قرار میگیرند. اگر تعداد کارگران یک کارگاه کمتر از 17 نفر باشد و کمیته حفاظت فنی و بهداشت نداشته باشند در دستهی 2 قرار میگیرد. درخت تصمیمگیریCHAID : کارگاههایی که کمیته حفاظت فنی و بهداشت دارند اما تعداد کارگران آنها کمتر از 3 نفر است، در دسته 2 قرار میگیرند. اگر کارگاه فاقد کمیته حفاظت فنی و بهداشت باشد و ساعت کار مشخصی نداشته باشد در دستهی 2 قرار میگیرد. کارگاههای فاقد کمیته حفاظت فنی و بهداشت که در حال ساخت به دلیل کارهای ساختمانی هستند و یا تعطیل فصلیاند و یا به دلیل رکورد کاری تعطیل شدهاند، در دستهی 2 قرار میگیرند. درخت تصمیمگیریC5.0 : اگرکارگاه فاقد کمیته حفاظت فنی و بهداشت است و تعداد کارگران آنها نیز کمتر از 3 نفر باشد در دسته 2 قرار میگیرد. کارگاههای فاقد کمیته حفاظت فنی و بهداشت که در حال ساخت به دلیل کارهای ساختمانی هستند و یا تعطیل فصلیاند و یا به دلیل رکوردکاری تعطیل شدهاند، در دستهی 2 قرار میگیرند. کارگاههای فاقد کمیته حفاظت فنی و بهداشت که دایر میباشند و تعداد کارگران آنها از 7 نفر بیشتر است، اگر یک شیفته و یا دو شیفته کار میکنند در دستهی 1 قرار میگیرند اما اگر سه شیفته کار میکنند در دستهی 2 قرار میگیرند. درخت تصمیمگیری C&Rtree: کارگاههایی که وضع رفاهی مشخصی ندارند و همچنین وضع ساعت کارشان نیز مشخص نیست و یا شب کار هستند در دستهی 2 قرار میگیرند. کارگاههایی که وضع رفاهی مشخصی ندارند و به صورت روزکار، روزکار و شبکار، متناوب و یا نوبتی کار میکنند و تعداد کارگران آنها از 8 نفر کمتر است و تعداد کارگران مرد آنها از 5 نفر بیشتر است و فاقد کمیته حفاظت فنی و بهداشت هستند در دستهی 2 قرار میگیرند. کارگاههایی که وضع رفاهی مشخصی ندارند و به صورت روزکار، روزکار و شبکار، متناوب و یا نوبتی کار میکنند و تعداد کارگران آنها از 8 نفر بیشتر است و کارگاه در حال ساخت به دلیل کارهای ساختمانی میباشد در دستهی 2 قرار میگیرند. 1-1-5-4-3-3-تحلیل کدکارگاههای 504 و 3713 با سطح ریسک شدید: دو کارگاه 504 و3713، با توجه به این مدل، سطح ریسک آنها شدید و بحرانی تشخیص داده شده است و به صورت مجزا تحلیل میشوند. در ابتدا خروجی مدل با جدول کارگاه ادغام میشود و سپس یک سری اطلاعات دربارهی وضعیت این دو کارگاه از جدول کارگاه استخراج میشود(جدول16-3). جدول16-3: اطلاعات مربوط به وضعیت دو کارگاه 504 و 3713 کد5043713فعالیت اصلیساختمان سازیصنعت و تولیدتعداد کارگر مرد403تعداد اتباع بی پروانه23وضع کارگاهدایردایرمجوزنامشخصداردتعداد شیفت کاری1 شیفته1 شیفتهکمیتهی حفاظتنداردنداردمسئول ایمنینداردنداردبیمهی مدنینامشخصنامشخصوضع رفاهینامشخصسرویس بهداشتیوضع حقوقیشركت تعاونيفردي و شركت غير رسميوضع ساعت کارنامشخصروزکارتعداد حادثه4 حادثه3 حادثه حالتدوم: وضعیت کارگاهها با سطح ریسک پایین درمقابل کارگاهها با سطح ریسک بالا(جدول17-3). جدول17-3: تقسیمبندی سطح ریسک در حالت2 سطح ریسکتعداددستهکم781بالا، خیلی بالا، شدید502 2-5-4-3-3- قوانین استخراج شده از مدلهای درخت تصمیمگیری(حالت دوم): درخت تصمیم گیریCHAID : کارگاههای 1 شیفته، 2 شیفته و یا 3 شیفته که بین 1 تا 6 کارگر مرد دارند و بیمهی مدنی نیز نداشته باشند در دستهی 2 قرار میگیرند. کارگاههای 1 شیفته، 2 شیفته و یا 3 شیفته که تعداد کارگران مرد آنها بیشتر از 6 نفر است و جز شرکتها ی تعاونی محسوب میشوند در دستهی 2 قرار میگیرند در غیر اینصورت در دستهی 1 قرار میگیرند. کارگاههایی با تعداد کارگر کمتر از 13 نفر که فاقد امکانات رفاهی هستند در دستهی 2 قرار میگیرند. درخت تصمیم گیریC5.0 : کارگاههایی که تعداد کارگران آنها از 8 نفر کمتر است و تنها امکانات رفاهی آنها سرویس بهداشتی است و بیمهی مدنی ندارند در دستهی 2 قرار میگیرند. کارگاههایی که تعداد کارگران آنها بیشتر از 8 نفر است در دستهی 1 قرار میگیرند. حالت سوم: وضعیت کارگاهها با سطح ریسک خیلیکم درمقابل کارگاهها با سطح ریسک متوسط(جدول18-3). جدول18-3: تقسیمبندی سطح ریسک در حالت3 سطح ریسکتعداددستهخیلیکم1821متوسط 1982 3-5-4-3-3- قوانین استخراج شده از درخت تصمیم گیری(حالت سوم): درختتصمیمگیریC5.0: کارگاههای دایر و روزکار که تعداد کارگران آنها از 8 نفر کمتر است و کمیته حفاظت فنی و بهداشت نداشته باشند و 1 شیفته و یا 3 شیفته کار میکنند در دستهی 2 قرار میگیرند. درختتصمیمگیریCHAID : کارگاههای روزکار و مختلطکار که تعداد کارگران آنها از 50 نفر کمتر است و در حال ساخت به دلیل تعمیرات ساختمانی هستند در دستهی 2 قرار میگیرند. درخت تصمیمگیری C&Rtree: تمامی کارگاهها به غیر از کارگاههایی که در شب کار میکنند و تعداد کارگران آنها بیشتر از 7 نفر است و در حال ساخت به دلیل تعمیرات ساختمانی هستند در دستهی 2 قرار میگیرند. تمامی کارگاهها، به جز کارگاههایی که در شب کار میکنند و یا تعداد کارگران آنها بین 1 تا 8 نفر است و امکانات رفاهی و کمیته حفاظت فنی و بهداشت ندارند در دستهی 2 قرار میگیرند. درخت تصمیمگیری QUEST: کارگاههای روزکار، مختلطکار و شبکار که در وضعیت تعطیل موقت و یا تغییر ساختار هستند و یا در حال تعمیرات ساختمانی میباشند، اگر فعالیت آنها به صورت کارگاههای ساختمانی باشد در دستهی2 قرار میگیرند ولی اگر در بخش صنعت و تولید کار میکنند در دستهی 1 قرار میگیرند. 5-3-3- کاربرد مدل DFSRM: یکی از کاربردهای مهمی که میتوان برای این مدل بیان کرد، استفاده از آن در بازرسیهای ادواری میباشد. در ابتدای هر سال، بازرسین، لیست کارگاههایی را که در نظر دارند مورد بازرسی قرار دهند مشخص میکنند. هر بازرس بدون در نظر گرفتن شرایط کارگاهها و سوءسابقه آنها در سالهای قبل، یک لیست از کارگاههایی که میخواهد بازرسی انجام دهد تهیه کرده و بدون اطلاع قبلی از کارگاهها بازرسی میکند. به طور مثال اگر کارگاهی در اسفندماه بازرسی شود معمولا در سال بعد نیز در اسفندماه مورد بازرسی قرار خواهد گرفت، مگراینکه حادثهای رخ دهد که همان بازرسی از حادثه میتواند بازرسی دورهای از کارگاه هم محسوب شود. این بازرسیها باید هر 6 ماه یکبار تکرار شوند و خود سیستم به گونهای طراحی شده است که تاریخ بازرسیهای بعدی را برای هر کارگاه تعیین میکند. اما مشخص نمیکند که کدام کارگاهها دارای شرایط بحرانی هستند و باید فورا به وضعیتشان رسیدگی شود. مدل DFSRM، به بازرسین کمک خواهد کرد تا سطح ریسک هر کارگاه را به صورت مجزا ارزیابی کنند و کارگاههایی را که وضعیتشان رو به بحرانی شدن میرود را شناسایی کرده و آنها را در راس بازرسیهای ادواری خود قرار دهند. 1-5-3-3- پیشنهاد بازرسی ادواری برای سال 90: برای نمونه در این تحقیق در ابتدا حادثهپذیرترین کارگاه در سال 1388 با استفاده از مدل DFSRM شناسایی شده و سطح ریسک هر دسته مشخص شده است. سپس همین عمل برای سال 1389 نیز تکرار خواهد شد. تا بتوانیم براساس دادههای قبلی نقاط بحرانی را شناسایی کرده و برای بازرسیهای ادواری سال90 یک لیست از کارگاههایی که نیاز به بازرسی دارند پیشنهاد نماییم. 2-5-3-3- شناسایی حادثهپذیرترین کارگاهها(سالهای 88 و 89) در این مرحله دو دیدگاه بررسی میشود: اگر در شناسایی ریسک کارگاهها مشخص شد که کارگاهی در سال 1388 دارای ریسک پایین بوده است ولی در سال 1389 دارای ریسک بالا میباشد، نتیجه میگیریم که این کارگاه دچار وضعیت بحرانی شده است و باید هر چه سریعتر وضعیت آن مورد بررسی قرار گیرد. اگر کارگاههایی در سال 1388 به عنوان کارگاهها با سطح ریسک پایین شناسایی شدهاند ولی در سال 1389 سطح ریسک متوسط رو به بالا دارند میتوان آنها را در لیست بازرسیهای ادواری سال 1390 قرار داد. 3-5-3-3- پیاده سازی مدل DFSRM: مرحلهی اول: متغیرهای مدل DFSRM همانگونه که قبلا شرح داده شد محاسبه میشوند (جداول19-3 و20-3). جدول 19-3: مقادیر متغیرهای مدل DFSRM- سال88 کد کارگاهDTIRSRRRM2500.8306750004301.25313317.5438621.98478010007.89141400018803.2175030.321751.03523034700.5835670003944114.005602157.5632206.76500….…………… جدول20-3: مقادیر متغیرهای مدل DFSRM- سال89 کد کارگاهDTIRSRRIM302.53300025101.66131.15051.75240000000004700.30500015301.26322.22228.0580161010.3314.6301.531017303.968000….…………… مرحلهیدوم: برای استفاده از الگوریتمهای خوشهبندی، متغیرهای مدل با استفاده از فرمول5، نرمالسازی میشوند(جداول21-3 و 22-3). جدول21-3: نرمالسازی متغیرهای مدل DFSRM- سال88 کد کارگاهNDTNIRNSRNRINM2500.0070004300.0110.0050010000.0030.0010018800.06600034700.027.0039400.005000….…………… جدول 22-3: نرمالسازی متغیرهای مدل DFSRM- سال 89 کد کارگاهNDTNIRNSRNRINM300.021000250.3850.0140.009014700.00300115300.0110.0060016100.0030.0010017300.009000….…………… مرحلهی سوم: برای پیدا کردن مقدارk بهینه، SSE با توجه به فرمول6، برای هر خوشه محاسبه خواهد شد(جداول23-3 و 24-3). جدول23-3: مقادیر SSE برای هر خوشه- سال88 SSEشماره خوشه87.62619252.67739343.3756440.62682532.19075628.534367 شکل4-3، نمودار SSE، برای نمایش K بهینه- سال88 جدول24-3: مقادیر SSE برای هر خوشه- سال89 SSEشماره خوشه115.4713279.30777372.10355463.87463559.36654652.49117 شکل5-3، نمودار SSE، برای نمایش K بهینه- سال89 مرحلهی چهارم: با استفاده از فرمول7، مقدار Di برای هر خوشه محاسبه میشود تا سطح ریسک هر خوشه مشخص شود(جداول25-3 و 26-3). جدول25-3: مقادیر Di برای هر خوشه و تعیین سطح ریسک- سال88 سطح ریسکDiNMNRINSRNIRNDTنام خوشهکم0.1568629980.020.0120.0150.1540.011خوشه 1زیاد1.541083710.3330.79510.7950خوشه 2متوسط1.512101187110.4190.3330خوشه 3 جدول 26-3: مقادیر Di برای هر خوشه و تعیین سطح ریسک- سال89 سطح ریسکDiNMNRINSRNIRNDTنام خوشهمتوسط0.304672000.0020.1050.286خوشه 1زیاد1.05306610.0720.1740.1830.2خوشه 2کم0.25229900.0020.0050.2510.025خوشه 3 مرحلهی پنجم: به هر خوشه یک امتیاز داده میشود و کد کارگاههایی که در هر خوشه قرار میگیرند مشخص میشوند(جداول27-3 و 28-3). جدول27-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند- سال88 خوشهسطح ریسکامتیازکد کارگاه1کم125، 43، 100، 188، 347، 394، 482، 515، 541، 731، 869، 927.......2زیاد33503، 3521، 3704، 3713، 4747، 49413متوسط247، 349، 375، 394، 417، 482، 504، 519، 595، 622، 854...... جدول28-3: نمایش کد کارگاههایی که در هر خوشه قرار میگیرند- سال89 خوشهسطح ریسکامتیازکد کارگاه1متوسط23، 47، 153، 161، 184، 349، 394، 417، 504، 519، 787، 854.....2زیاد325، 185، 2375، 2796، 3229، 3558، 3405، 3426، 3617.......3کم1173، 240، 255، 328، 589، 595، 608، 789، 876، 933، 954..... 4-5-3-3- تحلیل و بررسی نتایج: همانطور که در جداول بالا مشاهده میشود، 6 کارگاه در سال 89 با عنوان نقاط بحرانی شناسایی شدهاند و 15 کارگاه نیز دارای وضعیت بدتر بودهاند. در مجموع 21 کارگاه نیاز به توجه بیشتری دارند و باید در لیست بازرسیهای سال 1390 گنجانده شوند(جدول29-3). جدول29-3: کد کارگاههایی که در سال 90 نیاز به بازرسی دارند. کد کارگاهوضعیت 88وضعیت 893728، 3617، 3426، 3405، 3358، 25ریسک پایینریسک بالا394، 1484، 1488، 1959، 2647، 3285، 3522.....ریسک پایینریسک متوسط در این مرحله، وضعیت کارگاههایی که با عنوان نقاط بحرانی شناخته شدهاند مورد بررسی قرار میگیرد(جدول30-3). جدول30-3: وضعیت کارگاههایی که به عنوان نقاط بحرانی شناسایی شدهاند. کد کارگاه2533583405342636173728فعالیت اصلی1564344تعداد کارگر مرد1141504751030تعداد کارگر زن010010وضع کارگاه111111وضع حقوقی444111وضع ساعت کار015111بیمهی مدنی011210مسئول ایمنی211121کمیتهی حفاظت211221تعداد شیفتکاری233110 با توجه به جدول29-3، نیمی از کارگاه در بخش صنعت و تولید فعالیت میکنند و جز شرکتهای تعاونی محسوب میشوند. همگی دایر هستند و بیش از نیمی از آنها روزکار هستند. اکثر آنها دارای بیمهی مدنی بوده و مسئول ایمنی دارند اما فقط در نیمی از آنها کمیتهی حفاظت فنی و بهداشت وجود دارد. 3 تا از کارگاهها نیز، به صورت 2 یا 3 شیفته کار میکنند. توجه: برای تحلیل جدول30-3، به جداول 1-1-4 تا 4-1-4 و همچنین جداول 4-3 و 9-3 مراجعه کنید. شاید بتوان نتیجه گرفت که نداشتن کمیتهی حفاظت فنی و بهداشت و تعداد شیفتکاری که کارگران مجبور به کار هستند، تاثیر محسوسی در وضعیت ایمنی کارگاهها داشته است. تحلیلهای بیشتر باید توسط افراد خبره صورت پذیرد. جدول31-3: بررسی حوادث در کارگاههایی که به عنوان نقاط بحرانی شناخته شدهاند. کد کارگاه2533583405342636173728تعداد حوادث223141سختی حادثه333و132و33علت وقوع حادثه110000110000100100100000101010101100000100100000110100-100100---100010-110010-----110100عامل وقوع حادثه1000000010000100000000010000000000001001000010000110000000-10000000---10000000-100-----100-تعداد روز هدر75007500103007500103007500IR1.6611.5777.59923.81043.2903.968SR31.15029.565130.446892.857557.359148.810RI51.75246.617991.22921258.50324128.109590.514RE10189010Cost400000000040000000004000000000400000000040000000004000000000 با توجه به جدول31-3، همانطور که مشاهده میشود، 13 حادثه در6 کارگاه رخ داده است که آمار قابل توجهی میباشد. یعنی بیش از نیمی از کارگاهها، 2 و یا بیش از دو حادثه داشته و هر 6 کارگاه حداقل یک حادثه منجر به فوت داشتهاند. در تحلیل علت وقوع حوادث، در تمامی کارگاهها بدون استثنا، عدم نظارت بر کارگاه توسط کارفرما علت اصلی شناخته شده است. در 4 مورد عدم آموزش کارگر توسط کارفرما، در 4 مورد دستگاه بدون حفاظ و یا دارای نقص فنی بوده است و همچنین در دو مورد عدم تهیه وسایل استحفاظی علت اصلی حادثه تشخیص داده شده است. در همهی این موارد کارفرما مقصر میباشد. تنها در 1 مورد سهل انگاری و بی احتیاطی حادثهدیده نیز در وقوع حادثه دخیل بوده است(به جدول2-2-4مراجعه کنید). در تحلیل عوامل وقوع حادثه، در4 مورد تماس با مواد شیمیایی خطرناک عاملاصلی حادثه تشخیص داده شده است. در 3 مورد سقوط کردن و لغزیدن و در سه مورد دیگر برخورد با اشیاء و تجهیزات و دو مورد بعدی مربوط به سقوط اشیاء و انفجار است و در یک مورد نیز عامل حادثه ذکر نشده است(به جدول1-2-4 مراجعه کنید). 6-5- منابع: BIBLIOGRAPHY Anand, S., Keren, N., Tretter, M. J., Wang, Y., O’Connor, T. M., & Mannan, M. S. (2006). Harnessing data mining to explore incident databases",. Hazardous Material , 130, 33-41.Burez, J., & Van den Poel, D. (2009). Handling class imbalance in consumer churn prediction. Expert System Application , 36, 4626-4636.Cheng, H. C., & Chen, S. Y. (2009). Classifying the segmentation of customer value via RFM model and RS theory. Expert Systems with Applications , 36 (3), 4176–4184.Conte, J. C., Rubio, E., García, A. I., & Cano, F. (2011). Occupational accidents model based on risk–injury affinity groups. Safety Science , 49, 306-314.Fabiano, B., Currò, F., Reverberi, A. P., & Pastorino, R. (2008). A statistical study on temporary work and occupational accident: Specific risk factors and risk management strategic. Safety Science , 46, 535-544.Gürbüz, F., Özbakir, L., & Yapici, H. (2009). Classification rule discovery for the aviation incidents results in fatality. Knowledge-Based System , 22, 622-632.Hintikka, N., & Saarela, K. L. (2010). Accidents at work related to violence – Analysis of Finnish national accident statistic database. Safety Science , 48, 517-525.Keren, N., Anand, S., & Mannan, M. S. (2006). Calibrate failure-based risk assessments to take into account the type of chemical processed in equipment. Loss Prevention , 19, 714-718.McCarty, J. A., & Hastak, M. (2007). Segmentation approaches in data-mining: A comparison of RFM, CHAID, and logistic regression. Journal of Business Research , 60, 656–662.Meel, A., O’Neill, L. M., Levin, J. H., Seider, W. D., Oktem, U., & Keren, N. (2007). Operational risk assessment of chemical industries by exploiting accident databases. Loss Prevention , 20, 113-127.Mirabadi, A., & Sharifian, S. (2010). Application of association rules in Iranian Railways (RAI) accident data analysis. Safety Sience , 48, 1427-1435.Papadopoulos, G., Georgiadou, P., Papazoglou, C., & Michaliou, K. (2010). Occupational and public health and safety in a changing work environment: An integrated approach for risk assessment and prevention. Safety Science , 48, 943-949.Peng, Y., Zhang, Y., Tang, Y., & Li, S. (2010). An incident information management framework based on data integration, data mining, and multi-criteria decision making. Decision Support Systems , xxx, xxx-xxx.Sari, M., Selcuk, A. S., Karpuz, C., & Duzgun, H. B. (2009). Stochastic modeling of accident risks associated with an underground coal mine in turkey. Safety Science , 47, 78-87.اخوان بهبهانی, ع. (1390, اردیبهشت 7). اجتماعی: پیوند کار و سلامت. بازيابی در دی 13, 1390، از وب سایت جام جم آنلاین: http://www.jamejamonline.irارقامی, ش., & بویا, م. (1385). اصول ایمنی در صنعت و خدمات. تهران: فن آوران.ستاره, ه., & کوهپایی, ع. (1384). ارزیابی ریسک حریق (نسخه اول). تهران: نشر آوران.سلطانی نسب, ا., خادمی, م., حسنی, م. ا., شعبانی, م., & حسنی, ل. (1386). نگرشی بر حوادث ناشی از کار و نحوه بررسی آنها. تهران: آرام دل.شهرابی, ج., & پرهیزی, ش. (1387). ارائه یک متدولوژی نوین در تحلیل حوادث با استفاده از تکنیک های داده کاوی. کنفرانس داده کاوی ایران (ص. 13-1). تهران: دانشگاه امیرکبیر.شهرابی, ج., & پرهیزی, ش. (1387). استفاده از متدولوژی DMAA در یک مطالعه ی موردی در یک مجتمع پتروشیمی. کنفرانس داده کاوی ایران (ص. 16-1). تهران: دانشگاه امیرکبیر.غضنفری, م., علیزاده, س., & تیمورپور, ب. (1387). داده کاوی و کشف دانش. تهران: دانشگاه علم و صنعت ایران.کوهپایی, ع., ستاره, ه., & اعلایی, ا. (1385). مهندسي ايمني فرايند (با رويكرد طراحي ذاتاً ايمن). تهران: فن آوران. ABSTRACT A new model for assessment occupational and improvement work safety using data mining techniques; case study: Data in Qom state By Maryam Sadat Hajakbari Precaution of work accident or the prediction of them is the quote that all of the experts and professionals of work and industrial communication. In the last century, with the increasing development and expansion of industrial machinery, it become more and more important in all aspect of social and economical of life. Searching for high risks area, can be uses as a method for increasing the knowledge of work accident precaution. The aim of this research is using of Data Mining tool for instructing a new model of risk assessment of work accident. For this purpose, we use data of Ministry of Labor and Social Affairs. The result show this model can with high accuracy predict and analysis the high risk areas of work accident. IN THE NAME OF GOD A new model for assessment occupational and improvement work safety using data mining techniques; case study: Data in Qom State BY Maryam Sadat Hajakbari THESIS SUBMITTED TO THE SCHOOL OF GRADUATE STUDIES IN PARTIAL FULFILLMENT OF THE REQUIREMENTS FOR THE DEGREE OF MESTER OF SCIENCE (MSc.) IN ENGINEERING INFORMATION TECHNOLOGY (ELECTRONIC COMMERCE) NOORETOUBA VIRTUAL UNIVERSITY TEHRAN ISLAMIC REPUBLIC OF IRAN EVALUATED AND APPROVED BY THE THESIS COMMITTEE AS: EXCELENT Mr. Doctor Behrouz Minaei (CHAIRMAN) Mr. Engineer Jafar Pouramini (CONSULTANT) Mr. Engineer Reza Ahsan (ARBITRATOR) Nooretouba University A thesis for the degree of M.S. Engineering Information Technology A new model for assessment occupational and improvement work safety using data mining techniques; Case study: Data in Qom State Supervised by: Mr. Doctor Behrouz Minaei Advised by: Mr. Engineer Jafar Pouramini By: Maryam Sadat Hajakbari 9/2011