پیش بینی و بررسی تأثیر عوامل مختلف بر بازخرید بیمه زندگی

عباس خندان(عضو هیئت علمی دانشگاه خوارزمی)

شماره 162

پیش بینی و بررسی تأثیر عوامل مختلف بر بازخرید بیمه زندگی

خلاصه مدیریتی

بیمه زندگی یک محصول مهم بیمه ای و برنامه ریزی مالی است اما متأسفانه نفوذ کمی در بازار و در میان افراد جامعه به ویژه در ایران دارد. طبق گزارش سالنامه آماری بیمه مرکزی (1399) متوسط جهانی ضریب نفوذ بیمه های زندگی در سال 2020 برابر 3/3 درصد بوده که از ضریب نفوذ بیمه های زندگی در ایران برابر 36/0 درصد بسیار بیشتر است. یکی از دلایل ضریب نفوذ پایین نیز بازخرید بیمه نامه هاست که به دلایل متعددی می تواند اتفاق بیافتد اما در این طرح تمرکز اصلی بر بررسی تأثیر مؤلفه های اجتماعی است. مؤلفه‌های اجتماعی خود طیف وسیعی از عوامل را در بر می گیرد که به دلایل محدودیت داده ها و اطلاعات تنها برخی از این عوامل مورد بررسی قرار می گیرند. در این طرح برای پاسخ به سؤالات، از داده های آماری و اطلاعات ثبتی 37269 نفر از خریداران بیمه نامه های عمر و مستمری شرکت بیمه پایلوت در مقطع سال 1400 استفاده شد. این افراد کسانی هستند که از فروردین 1395 این بیمه نامه را خریده اند و تا سال 1400 همچنان مشتری این بیمه نامه شرکت باقی مانده اند. با نگاه به آمار بیمه نامه ها می توان دید که متغیر هدف یا وابسته یعنی بیمه‌نامه‌های بازخریدی، حدود 25/2 درصد از بیمه نامه ها را تشکیل می دهند که این طرح به دنبال پیش بینی و توضیح آن است.

به پشتوانه حجم عظیم داده ها و اطلاعات جمع آوری شده، برای این منظور و بررسی رفتار افراد در بازخرید بیمه نامه زندگی و شناخت ویژگی ها و مشخصه های آنان از داده‌کاوی استفاده می شود. فرآیند داده کاوی شش مرحله دارد که مرحله اول و دوم آن یعنی درک کسب وکار و درک داده ها در فصول اول تا سوم انجام گرفت. در فصل سوم، برای درک داده ها یک سری آمار توصیفی از متغیرها و مشخصه‌های بیمه شدگان ارائه شد و سپس به مرحله سوم از داده کاوی یعنی آماده سازی داده ها پرداخته شد. منظور از آماده سازی، فراهم کردن داده های مناسب برای ورود به الگوریتم می باشد. آماده سازی خود از چند مرحله پیش پردازش داده ها و هممقیاس سازی تشکیل شده است. در پیش پردازش داده ها پس از حذف داده های تکراری و پرت در نهایت تعداد 35171 بیمه نامه برای استفاده در مدل سازی آماده شد. با حذف مقیاس و واحد از متغیرها، داده ها به شکل استاندارد با میانگین صفر و واریانس 1 در آمدند.

مرحله چهارم از داده کاوی مدلسازی است که در این پژوهش از یادگیری عمیق با شبکه های عصبی استفاده شد. مزیت اصلی استفاده از شیوه های جدید یادگیری ماشینی دقت بالاتر آن ها در پیش بینی است که به واسطه رویکرد سیستمی و غیرخطیِ این روش ها حاصل می شود. در یادگیری عمیق که یکی از روش های یادگیری ماشینی است، از شبکه های عصبی در لایه های متوالی به منظور یادگیری داده ها به صورت تکرار شونده استفاده می شود. معماری شبکه عصبی و ابرپارامترهای آن البته تأثیر خیلی زیادی بر عملکرد آن دارند که نیاز است به نحو مناسبی تنظیم شوند. این مهم به روش اعتبارسنجی متقاطع و معیارهای ارزیابی مختلفی انجام می شود. در این طرح پس از اعتبارسنجی مدل های مختلف، در نهایت یک مدل شبکه عصبی با 3 لایه پنهان به ترتیب با تعداد 32، 16 و 8 نرون استفاده شد که مقادیری بین تعداد نرون لایه ورودی (تعداد مشخصه ها 45) و تعداد نرون لایه خروجی (یک خروجی 1) گرفته اند. یک مشکل بزرگی که در این پژوهش و در پیاده سازی مدل شبکه عصبی وجود داشت عبارت بود از توزیع نامتوازن داده ها که با جزئیات به آن پرداخته شد. منظور از توزیع نامتوازن این است که در مجموعه داده ها فراوانی و تعداد مشاهدات یک طبقه نسبت به سایر طبقات به شدت بیشتر باشد. توزیع نامتوازن در داده های این پژوهش به این صورت است که نسبت بیمه نامه های بازخریدی به عدم بازخرید 3 به 100 بوده و این موجب می شود فرآیند یادگیری به سمت پیش بینی طبقه با بیشترین فراوانی سوگیری پیدا کند و مدل در پیش بینی طبقه اقلیت عملکرد موفقی نداشته باشد. مهم این که اتفاقاً موضوع مورد مطالعه این پژوهش هدف شناخت و پیش بینی طبقه داده یا شواهد اقلیت است. در این پژوهش با اعمال یک تابع زیان همراه با جریمه در شبکه عصبی برای رفع این مشکل اقدام شد تا کم توجهی به طبقه اقلیت داده ها در فرآیند یادگیری جبران شود.

مرحله پنجم از داده کاوی، اعتبارسنجی مدل است. مدل نهایی با داده های آموزش (70 درصد مجموعه داده ها) فرآیند یادگیری را طی کرد و سپس با داده های تست به آزمون گذاشته شد. شاخص دقت 74 درصدی مدل در پیش بینی هر دو نوع بیمه نامه های عدم بازخرید و بازخرید شده عملکرد مطلوبی است. در پیش بینی عدم بازخرید بیمه نامه ها عملکرد بسیار بهتر بود اما چون موضوع اصلی پژوهش، پیش بینی بیمه نامه های بازخرید شده است، در تفسیر نتایج بیشتر به آن توجه شد. نتایج بدست آمده با وجود مشکل نامتوازن بودن داده ها مطلوب است. شاخص پوشش 59 درصدی بدست آمده نشان داد که از مجموع 244 بیمه نامه بازخرید شده در مجموعه داده تست، شبکه توانسته اغلب آنان یعنی 145 مورد را به درستی در طبقه بیمه نامه های بازخریدی پیش بینی و طبقه بندی کند. در پایان با نگاه به درون این شبکه پیچیده که به «جعبه سیاه» شهرت دارد، تلاش شد تاحدی به تأثیر عوامل و مشخصه های مختلف در بازخرید بیمه نامه ها پرداخته شود. نتایج بدست آمده نشان دادند که از مجموع مشخصه های جمعیت شناختی متغیرهای سن، جنسیت زن، اضافه نرخ پزشکی (نشانگر سلامت فرد)، نرخ خطر حادثی (نشانگر حوادث شغلی فرد) با بازخرید بیمه نامه بهصورت عکس مرتبط هستند. نسبت بیمه گذار و بیمه شده نیز یکی از عوامل اجتماعی تأثیرگذار است و نتایج نشان دادند احتمال بازخرید وقتی بیمه گذار بیمه نامه زندگی را برای خود بخرد در حدأقل است اما با دور شدن نسبت خویشاوندی احتمال بازخرید افزایش می یابد. از میان مشخصه های قراردادی نیز مدت بیمه نامه، مدت زمان سپری شده از شروع بیمه نامه، شیوه پرداخت حق بیمه با اقساط بلندمدت تر، بالاتر بودن ضرایب افزایش سالانه سرمایه و حق بیمه (تعدیل مناسب با تورم) و کمتر بودن تعداد موارد پوشش و سرمایه فوت (و در نتیجه حق بیمه کمتر) با احتمال بازخرید اثر عکس داشته و آن را کاهش می دهند.

 

امتیاز :  ۲.۵۰ |  مجموع :  ۲

برچسب ها
    پژوهشکده بیمه
    6.1.7.0
    V6.1.7.0