Почистване на файлове в случай на индивидуални данни, търсещи напречна последователност

Кремп Елизабет. Почистване на файлове в случай на отделни данни: търсене на напречна последователност. В: Икономика и прогнозиране, n ° 119, 1995-3. стр. 171-193.

индивидуални

Почистване на файлове за отделни данни

Търсене на напречна съгласуваност

Отделен файл с данни за няколко години, наричан още панелни данни, може да се характеризира с три измерения: брой индивиди, брой информация, т.е. променливи, позволяващи да се характеризират тези индивиди, и брой години, за които това налична е информация. В допълнение към тези три характеристики може да се вземе предвид и четвърта, която е по-трудна за измерване, което е качеството на тази информация.

Проблемът с почистването на извадка възникна в контекста на сравнението на счетоводните бази данни на компании от Banque de France с изчерпателните данни на Единната система за бизнес статистика (Susa) на Insee. Преди да можете да сравните тези различни бази данни, е важно да разполагате с надеждна статистика (1). По-общо този проблем с идентифицирането на екстремни или по-далечни данни възниква при извършване на приложни икономически проучвания, които използват данни от проучвания.

След като се опита да изясни тези понятия за извънредни стойности и екстремни стойности, тази статия припомня статистическите инструменти и представя различни непроменени методи за идентифициране на тези стойности. Многовариантните методи не се изследват тук, защото те не само зависят от теоретичен модел, но изглеждат много тромави за прилагане в случай на индивидуални и временни файлове с данни с размера на тези, използвани в това проучване (2). След това осем техники, изградени от тези инструменти и методи, се тестват във файла за бизнес банкиране на Banque de France (Fiben), по критерия за съотношението на клиентите на условията за плащане. И накрая, прилагането на три от тези техники към седем съотношения дава възможност да се сравнят, да се оцени ролята на избора на съотношения и да се измери кумулативните явления на елиминиране на наблюденията.