1 - در این مسئله هدف نوشتن کد Naive Bayes در یک مسئله تصمیم گیری باینری است. داده مورد استفاده ( فایل ارسالی votr.txt ) دارای 325 مثال است که هرکدام شامل 16 مشخصه و یک خروجی ( همگی باینری ) می باشد. این داده نمایش دهنده رای آری ( یک منطقی ) یا نه ( صفر منطقی ) نمایندگان کنگره آمریکا به 16 طرح مختلف می باشد. این طرح ها به ترتیب عبارتند از :
- HANDICAPPED-INFANTS
- WATER-PROJECT-COST-SHARING
- ADOPTION-OF-THE-BUDGET-RESOLUTION
- PHYSICIAN-FEE-FREEZE
- EL-SALVADOR-AID
- RELIGIOUS-GROUPS-IN-SCHOOLS
- ANTI-SATELLITE-TEST-BAN
- AID-TO-NICARAGUAN-CONTRAS
- MX-MISSILE
- IMMIGRATION
- SYNFUELS-CORPORATION-CUTBACK
- EDUCATION-SPENDING
- SUPERFUND-RIGHT-TO-SUE
- CRIME
- DUTY-FREE-EXPORTS
- EXPORT-ADMINISTRATION-ACT-SOUTH-AFRICA
ستون هفدهم داده ارسالی نیز نشان دهنده دموکرات ( یک منطقی ) یا جمهوری خواه ( صفر منطقی ) بودن نماینده مورد نظر است. داده ارسالی را به 5 بخش مساوی تقسیم کنید ( بخش اول 65 سطر اول ، بخش دوم 65 سطر دوم و ... ) و با استفاده از Cross-Validation میزان خطای الگوریتم Naive Bayes در دسته بندی را محاسبه نمایید. مشخص کنید وزن و تمایل هر یک از 16 مشخصه در دسته بندی چیست؟
2 - استفاده از نزدیکترین همسایه برای یادگیری
در این مسئله هدف استفاده از برنامه نویسی نزدیک ترین همسایه در دسته بندی بیماری غده تیروئید است. داده مورد استفاده دارای 100 مثال است که هر کدام شامل 7 مشخصه و یک خروجی می باشد. خروجی می تواند یکی از مقادیر 0 ( معادل عدم تشخیص بیماری ) یا 1 ، 2 یا 3 ( تشخیص بیماری با یکی از سه کلاس مختلف ) باشد. مشخصه ها نیز به ترتیب عبارتند از
- AGE
- ON THYROXINE
- TSH MEASURED
- TSH
- T3
- TT4 MEASURED
- TT4
که مشخصه های 2 ، 3 و 6 باینری و باقی مشخصه ها حقیقی هستند.
داده مورد نظر را به 5 بخش مساوی تقسیم کنید و با استفاده از Cross-Validation اثر تغییر k ( از مقادیر 1 تا 10 ) را بر روی متوسط خطای دسته بندی در الگوریتم k-Nearest Neighbor محاسبه نمایید. نمودار خطای متوسط بر حسب k را ترسیم نمایید. کمترین میزان خطا به ازای چه مقداری از k بست می آید.
این کار را در دو حالت انجام دهید : 1 - حالتی که داده غیرنرمالیزه وارد الگوریتم می گردد و 2 - حالتی که داده به گونه ای نرمالیزه می شود که میانگین هر یک از مشخصه ها صفر و واریانس آن ها واحد می گردد.
3 -
جهت سفارش پروژه ، تکلیف و آموزش یادگیری ماشین Machine Learning لطفا با متلب خونه تماس بگیرید، تا پس از بررسی هزینه خدمت شما اعلام گردد.
پشتیبانی ( تلفن ثابت دفتر متلب خونه ) : 02191307193
تلگرام و ایتا : 09364847193