یادگیری بدون نظارت و خوشه‌بندی رفتاری مؤدیان مالیاتی حقوقی: مطالعه موردی استان سمنان
کد مقاله : 1065-TAXRESEARCH
نویسندگان
سعید ایزدبخش *
کارشناس آموزش و پژوهش اداره کل امور مالیاتی استان سمنان
چکیده مقاله
با پیچیده‌تر شدن نظام مالیاتی و افزایش تنوع در رفتار مؤدیان، استفاده از رویکردهای داده محور برای تحلیل و ارتقای سطح تمکین مالیاتی اهمیتی روزافزون یافته است. این پژوهش باهدف بررسی امکان شناسایی الگوهای رفتاری مؤدیان حقوقی از طریق یادگیری بدون نظارت انجام شد. مطالعه از نوع کاربردی و مبتنی بر تحلیل داده‌های ثبتی بود. جامعه آماری شامل مؤدیان حقوقی استان سمنان در سال مالی ۱۴۰۱ بود که پس از حذف داده‌های ناقص یا پرت با استفاده از Z-Score، ۵۷۴ نمونه معتبر برای تحلیل انتخاب شد. داده‌ها شامل متغیرهای عددی (درآمد، فروش، مالیات ابرازی، مالیات تشخیصی) و طبقه‌ای (نوع ریسک اظهارنامه و اداره رسیدگی‌کننده) بودند. تحلیل داده‌ها با الگوریتم خوشه‌بندی KMeans، آزمون همبستگی پیرسون و رگرسیون خطی ساده انجام شد. یافته‌ها فرضیه اول را تأیید کردند و نشان دادند که می‌توان مؤدیان را به‌طور معناداری به سه خوشه رفتاری متمایز تقسیم کرد. فرضیه دوم رد شد، چراکه بین برچسب‌های ریسک موجود و خوشه‌های رفتاری شناسایی‌شده همبستگی معناداری وجود نداشت. همچنین فرضیه سوم تأیید شد و مشخص گردید که متغیرهای مالی نسبت به متغیرهای اداری، قدرت بیشتری در پیش‌بینی رفتار تمکینی دارند. این نتایج بر کارآمدی روش‌های یادگیری بدون نظارت در تحلیل رفتار مالیاتی و لزوم بازنگری در نظام‌های ارزیابی ریسک فعلی تأکیددارند.
کلیدواژه ها
یادگیری ماشین ، خوشه‌بندی رفتاری ، تمکین مالیاتی ، تحلیل بدون نظارت، مؤدیان مالیاتی حقوقی، تحلیل رگرسیونی، شناسایی مؤدیان پرریسک
وضعیت: پذیرفته شده