كيفية استخدام البيانات الإدارية كمؤشر استباقي للتغيرات سوق العمل
عادة ما يقيم الخبراء وصناع القرار تغيرات سوق العمل من خلال متابعتهم للإحصائيات الصادرة من مسح القوى العاملة وعلى الرغم من المعلومات المفصلة التي توفرها المسوح الميدانية، ولكن يعاب على المسوح الميدانية كما ذكرت في مقالات سابقة وجود ما يسمى بال time-lagاو فجوة بين المدة الزمنية التي يقيس فيها المسح الميداني وضع سوق العمل وتوقيت النشر وكلما زادت هذه المدة الزمنية بين القياس والنشر كلما قلت الفائدة التي يجنيها صناع السياسات من هذه المعلومات. فمثلا، مسح القوى العاملة المنشور من هيئة الاحصاء الأسبوع الماضي يقيس تحركات سوق العمل والقطاع الخاص بين July-Sept 2022 مما يعني ان المدة الزمنية بين فترتي القياس والنشر تقارب ال٣ أشهر وهذا يقلل من قدرة صناع القرار في الوزارات ذات العلاقة من التعامل مع متغيرات سوق العمل كالبطالة في الوقت المناسب.
ولذلك، اقترح في هذه المقالة استخدام ما يسمى بال high-frequency data كبيانات برنامج ساند الإدارية المنشورة من التأمينات الاجتماعية كمؤشر استباقي لتحركات سوق العمل المستقبلية واهم ارقامها مثل البطالة. برنامج ساند يقدم تأمين ضد البطالة لكل من فقد وظيفته في القطاع الخاص ومما يميز مصادر البيانات الإدارية مثل ساند انها تحدث بشكل اسبوعي على عكس مسح القوى العاملة الذي يحدث كل ١٢ أسبوع وهامش الخطأ في البيانات الإدارية عادة ما يكون اقل بكثير من المسوح الميدانية وهذا يفسر قيام الكثير من الاقتصاديين وصناع القرار مؤخرا بالسنوات الأخيرة باستخدام البيانات الإدارية كأداة استباقية للتحركات في نسبة البطالة وتحديدا استخدامهم لأعداد المستفيدين من التامين ضد العطالة[1] لفهم توجهات البطالة المستقبلية. [2]
تصل العلاقة الإحصائية بين المتغيرين الى 0.80 في سوق العمل الأمريكي، أي ان ارتفاع عدد المستفيدين من التأمين ضد البطالة بنسبة %1 يقابله ارتفاع بحوالي 0.8٪ في نسبة البطالة. لذلك سأختبر ما إذا كانت العلاقة بين المتغيرين في قطاعنا الخاص مشابهة للقطاع الخاص الأمريكي وسأقوم بالإجابة عن ذلك باستخدام نفس المنهجيات المستخدمة في الدراسات السابقة.[3]
١- هل توجد علاقة بين بيانات ساند في الربع الأول ونسبة البطالة في الربع الأول؟ او
٢- هل توجد علاقة بين بيانات ساند في الربع الأول بنسبة البطالة في الربع الثاني من نفس العام؟
الإجابة نعم لكل السؤالين، ولكنها ضعيفة احصائيا[4] وخصوصا إذا ما قرناها بالقطاع الخاص الأمريكي. قد يتساءل البعض عن أسباب ضعف العلاقة الإحصائية بين المتغيرين في قطاعنا الخاص وتحديدا: ما الذي يجعل ارقام العاطلين في برنامج ساند لا تؤثر بشكل واضح احصائيا على نسبة البطالة؟
اعتقد ان هذا يعود لعدة عوامل، ولكن سأركز على اهم سببين:
أولا، في أسواق العمل في الدول الصناعية مثل الولايات المتحدة معظم العاطلين هم من الافراد الذين يمتلكون خبرة عمل سابقة وفقدوا وظائفهم لأسباب مختلفة مثل افلاس الشركات[5]، بينما معظم العاطلين في سوق العمل لدينا لم يسبق لهم العمل حيث ان النسبة تصل ل%85 للنساء و%68 للذكور[6]، ولذلك التغيرات الربعية للمستفيدين من ساند لا يكاد يظهر اثرها على ارقام البطالة.
ثانيا، نسبة تعويض الراتب للعاطلين في قطاعنا الخاص هي%60 في الثلاث اشهر الأولى وهي اعلى من دول صناعية مثل اليابان واسبانيا وهذا يحفز بعض ممن فقدوا وظائفهم في قطاعنا الخاص بعدم البحث عن وظيفة ولذا قد لا يظهر اثر التغيرات الربعية في عدد المستفيدين من ساند في ارقام البطالة بنفس الفترة.
بناء على ذلك، سأختبر ما إذا كانت العلاقة الإحصائية بين المتغيرين لا تظهر الا بعد ربعين وتحديدا، بعد انخفاض نسبة الدعم المقدم من ساند ومن ثم يبدا العاطلون في البحث عن وظيفة ويتم احتسابهم في نسبة البطالة الرسمية؟ ولذا سأحاول الإجابة عن السؤال التالي:
٣- هل توجد علاقة بين بيانات ساند في الربع الأول بنسبة البطالة في الربع الثالث من نفس العام؟
نعم، العلاقة بالفعل إيجابية وواضحة احصائيا بين المتغيرين[7]. حيث ان العلاقة الموضحة في الرسم البياني التالي تدل على ان ارتفاع عدد المستفيدين من ساند في الربع الأول بنسبة ١٪ مرتبط احصائيا بارتفاع البطالة في الربع الثالث بنسبة
0.48%
أخيرا، على الرغم من ان العلاقة الاحصائية بين القطاع الخاص لدينا اقل مما هي عليه في الولايات المتحدة الامريكية، الا انه مؤشر يستحق المتابعة من صناع القرار نظرا لأنه يحدث بشكل اسبوعي مما يمكن صانع القرار بفهم تحركات سوق العمل مثل نسبة البطالة والتعامل معها بشكل مناسب، ولكن هذا لا يستنقص من أهمية او جودة بيانات سوق العمل المنشورة من هيئة الإحصاء ولكن البيانات الإدارية بإمكاننا الاستفادة منها كمؤشر تكميلي للإحصائيات الميدانية.
[1] The independent variable, which is log-transformed for all statistical models in the article, as performed in prior literature.
[2] The unemployment rate is our outcome/Y variable.
[3] Here I am using quarterly Saned data for every quarter since 2016 against the quarterly unemployment rate for nationals since 2016. There are 26 observations only, so I only ran a simple correlation but future iterations will include an OLS model.
[4] The coefficient is 0.32 between UI claims and the U-rate, compared to 0.8 in the U.S. and it’s not statistically significant in our context.
[5] The causal chain works as follows in a typical private sector: an individual loses their job in T1 and starts receiving UI benefits, and this appears as early as T2.
[6] GASTAT LFS Q3, 2022.
[7] The coefficient is larger at 0.48 and is statistically significant at the 0.05 p-value level, suggesting a positive relationship between the log-transformed Saned UI claims in T1, and the U-rate in T3.