Critical Success Question

advertisement
Бюро переписи США
Комплексная система десятилетних данных
по переписи населения (КСДДПН)
Использование устройств
высокоскоростной обработки данных
по переписи населения
Докладчик:
Треси Уэсслер
5 июня 2007г.
Часто незамечаемые важные
моменты
• Соответствует ли структура анкеты структуре
системы регистрации данных?
• Как система предупреждает потерю данных?
• Может ли устройство оптического считывания меток
правильно выбирать необходимые ответ в сложных
ситуациях?
• Считается, что эффективное использование
устройства оптического распознавания символов
требует значительных инвестиций в процесс
настройки и тестирования?
• Имеет ли системы возможность контроля и
обеспечения качества.
Аспекты структуры анкеты
• Основная причина ошибок системы
• Путаница респондентов приводит к ошибкам
регистрации данных
• Ориентированность на респондента в
сравнении с ориентированностью на систему.
• Влияние на точность регистрации данных
• Анкеты рассматриваются как исходные
данные для системы регистрации, включая
аспекты изменчивости данных респондентов.
Структура анкет обеспечивает
факторы проведения переписи
• Создание репрезентативной группы
специалистов в области содержания,
структуры, печати и рассылки анкет, а также
регистрации данных.
• Учет производителями устройств всех
трудностей, взаимодействий и альтернатив.
• Технологически современные системы
способны обрабатывать формы,
ориентированные на респондента, в отличие
от форм, ориентированных на компьютерную
обработку.
Предупреждение потери данных
• Как система обеспечивает контроль
данных?
• Отслеживание штрих-кода
• Выявление двойной подачи во время
сканирования
• Процесс подтверждения анкет
• Подтверждение данных (получение
данных)
Аспекты ОСМ
• Определяется как сбор данных из
многорядных клеток анкет
• Уделяется внимание оптическому
распознаванию ответа. Для Бюро переписи
важно знать ответ респондента, а не
содержание символов клетки анкеты.
• Устройство оптического распознавания
ответа является специальной формой ОСМ–
многие устройства ОСМ не проводят
оптического распознавания ответа
Аспекты оптического
распознавания символов
• Остерегается чрезмерных заявлений
продавцов о точности данных
• Бюро переписи надеется на получение
большого уровня зарегистрированных
данных с помощью ОРС (80% или
выше) и высокий процент точности
(99% или выше, определенный на
местах), что требует значительных
инвестиций в развитие
Аспекты оптического
распознавания символов
• Для Бюро переписи рентабельность
капиталовложений является очень важным
для большей части анкет в связи с большими
объемами переписи.
• Например, до разработки программы по
переписи 2000 и использования ОРС, было
невозможно зарегистрировать полные имена
со всех анкет. Регистрация имен имела
большое значение для решения проблемы
дублирования.
Качество данных
• Опыт БП показывает, что многие имеющиеся в
продаже приложения не включают соответствующий
контроль и обеспечение качества данных.
• Основное внимание БП – обеспечение качества
всего процесса
• Одного тестирования недостаточно для обеспечения
качества данных – даже самая тщательная проверка
не может полностью воспроизвести реальную
ситуацию с переписью населения.
• Качество данных оценивается в ходе
действительного процесса их обработки, так
выявляются и исправляются ошибки
Download